大数据工程师到底是什么?

kuaidi.ping-jia.net  作者:佚名   更新日期:2024-09-10
大数据工程师是做什么的

大数据工程师主要是,分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务:
找出过去事件的特征:大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。
预测未来可能发生的事情:通过引入关键因素,大数据工程师可以预测未来的消费趋势。
找出最优化的结果:根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。


扩展资料
大数据工程师需要学习的知识

1、linux
大数据集群主要建立在linux操作系统上,Linux是一套免费使用和自由传播的类Unix操作系统。而这部分的内容是大家在学习大数据中必须要学习的,只有学好Linux才能在工作中更加的得心应手。
2、Hadoop
我觉的大家听过大数据就一定会听过hadoop。Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,运算时利用mapreduce对数据进行处理。

参考资料来源:百度百科-大数据分析师

当前大数据平台开发岗位的附加值还是比较高的,大数据平台开发岗位往往集中在大型互联网企业,随着云计算逐渐从IaaS向PaaS过渡,大数据平台开发也会基于行业特点来开发针对性比较强的PaaS平台,这是整合行业资源并搭建技术生态的一个关键。搭建PaaS平台不仅需要掌握大数据知识,同时还需要掌握云计算知识,实际上大数据和云计算本身就有比较紧密的联系,二者在技术体系结构上都是以分布式存储和分布式计算为基础,只不过关注点不同而已。


大数据运维工程师以搭建大数据平台为主,虽然这部分岗位的门槛相对比较低,但是需要学习的内容还是比较多的,而且内容也比较杂,网络知识、数据库管理知识、操作系统(Linux)知识、大数据平台(含开源和商用平台)知识都需要掌握一些,对于实践操作的要求会比较高。


最后,当前大数据工程师往往并不包含专业的数据分析岗位,一般数据分析岗位都会单独列出来,这部分岗位涉及到算法岗、开发岗(实现)和数据呈现岗等,数据分析岗位对于从业者的数学基础要求比较高,同时还需要掌握大量的数据分析工具,当然也离不开Python、Sql等知识。

用阿里巴巴集团研究员薛贵荣的话来说,大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要。

沈志勇认为如果把大数据想象成一座不停累积的矿山,那么大数据工程师的工作就是,“第一步,定位并抽取信息所在的数据集,相当于探矿和采矿。第二步,把它变成直接可以做判断的信息,相当于冶炼。最后是应用,把数据可视化等。”

因此分析历史、预测未来、优化选择,这是大数据工程师在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策。



1.找出过去事件的特征
大数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。比如,腾讯的数据团队正在搭建一个数据仓库,把公司所有网络平台上数量庞大、不规整的数据信息进行梳理,总结出可供查询的特征,来支持公司各类业务对数据的需求,包括广告投放、游戏开发、社交网络等。
找出过去事件的特征,最大的作用是可以帮助企业更好地认识消费者。通过分析用户以往的行为轨迹,就能够了解这个人,并预测他的行为。“你可以知道他是什么样的人、他的年纪、兴趣爱好,是不是互联网付费用户、喜欢玩什么类型的游戏,平常喜欢在网上做什么事情。”腾讯云计算有限公司北京研发中心总经理郑立峰说。下一步到了业务层面,就可以针对各类人群推荐相关服务,比如手游,或是基于不同特征和需求衍生出新的业务模式,比如微信的电影票业务。
2.预测未来可能发生的事情
通过引入关键因素,大数据工程师可以预测未来的消费趋势。在阿里妈妈的营销平台上,工程师正试图通过引入气象数据来帮助淘宝卖家做生意。“比如今年夏天不热,很可能某些产品就没有去年畅销,除了空调、电扇,背心、游泳衣等都可能会受其影响。那么我们就会建立气象数据和销售数据之间的关系,找到与之相关的品类,提前警示卖家周转库存。”薛贵荣说。
在百度,沈志勇支持“百度预测”部分产品的模型研发,试图用大数据为更广泛的人群服务。已经上线的包括世界杯预测、高考预测、景点预测等。以百度景点预测为例,大数据工程师需要收集所有可能影响一段时间内景点人流量的关键因素进行预测,并为全国各个景点未来的拥挤度分级—在接下来的若干天时间里,它究竟是畅通、拥挤,还是一般拥挤?
3.找出最优化的结果
根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。
以腾讯来说,郑立峰认为能反映大数据工程师工作的最简单直接的例子就是选项测试(AB Test),即帮助产品经理在A、B两个备选方案中做出选择。在过去,决策者只能依据经验进行判断,但如今大数据工程师可以通过大范围地实时测试—比如,在社交网络产品的例子中,让一半用户看到A界面,另一半使用B界面,观察统计一段时间内的点击率和转化率,以此帮助市场部做出最终选择。

写 SQL (很多入职一两年的大数据工程师主要的工作就是写 SQL )

2 为集群搭大数据环境(一般公司招大数据工程师环境都已经搭好了,公司内部会有现成的大数据平台,但我这边会私下搞一套测试环境,毕竟公司内部的大数据系统权限限制很多,严重影响开发效率)

3 维护大数据平台(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作)

4 数据迁移(有部分公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中,这个是比较繁琐的工作,吃力不讨好)

5 应用迁移(有部分公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储过程程序或者SQL脚本迁移到大数据平台上,这个过程也是非常繁琐的工作,无聊,高度重复且麻烦,吃力不讨好)

6 数据采集(采集日志数据、文件数据、接口数据,这个涉及到各种格式的转换,一般用得比较多的是 Flume 和 Logstash)

7 数据处理
7.1 离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和第一点有点重复了)
7.2 实时数据处理(这个涉及到消息队列,Kafka,Spark,Flink 这些,组件,一般就是 Flume 采集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)

8 数据可视化(这个我司是用 Spring Boot 连接后台数据与前端,前端用自己魔改的 echarts)

9 大数据平台开发(偏Java方向的,大概就是把开源的组件整合起来整成一个可用的大数据平台这样,常见的是各种难用的 PaaS 平台)

10 数据中台开发(中台需要支持接入各种数据源,把各种数据源清洗转换为可用的数据,然后再基于原始数据搭建起宽表层,一般为了节省开发成本和服务器资源,都是基于宽表层查询出业务数据)

11 搭建数据仓库(这里的数据仓库的搭建不是指 Hive ,Hive 是搭建数仓的工具,数仓搭建一般会分为三层 ODS、DW、DM 层,其中DW是最重要的,它又可以分为DWD,DWM,DWS,这个层级只是逻辑上的概念,类似于把表名按照层级区分开来的操作,分层的目的是防止开发数据应用的时候直接访问底层数据,可以减少资源,注意,减少资源开销是减少 内存 和 CPU 的开销,分层后磁盘占用会大大增加,磁盘不值钱所以没什么关系,分层可以使数据表的逻辑更加清晰,方便进一步的开发操作,如果分层没有做好会导致逻辑混乱,新来的员工难以接手业务,提高公司的运营成本,还有这个建数仓也分为建离线和实时的)

总之就是离不开写 SQL ...

一般的话大数据是负责公司互联网数据分析的一个职位,简单的说如购物网站上的根据你的浏览给你推荐一些商品,另外还有从海量的数据中分析出对公司发现有指引作用的信息等都是大数据需要做的,现在来说大数据需求非常大,很有发展前景

  • 大数据工程师做什么
    答:大数据工程师的工作内容主要包括:数据采集、存储、处理、分析和挖掘。一、数据采集 大数据工程师的首要任务是收集数据。他们会利用各种工具和手段,从各种来源获取大量数据。这些数据可能是结构化的,比如数据库中的数字信息,也可能是非结构化的,如社交媒体上的文本信息或图片。采集数据是大数据项目的基础,...
  • 大数据工程师是做什么的
    答:大数据的发展,目前在国外其实已经相对成熟很多了,大数据工程师,在国外也被称为是数据科学家,主要是通过数据的价值挖掘,来为企业业务提供更精准的决策依据。在电信、零售、金融、制造、物流、医疗、教育等行业当中,大数据工程师已经在创造价值了。大数据开发工程师做什么?大数据开发工程师做什么,我们从...
  • 如何成为一个大数据开发工程师
    答:大数据工程师有多种解释,一种是用大数据的,就是data scientist这种。1.建立数据平台、2. 实现产品中依赖数据的部分、3.通过数据对具体问题进行调查分析、4.建立模型支持公司的决策。每一个Data Scientist都有不同的侧重点,但平均来说工作量大概各占1/4。一种是开发大数据平台的,就是平台开发工程师...
  • 大数据工程师是什么?
    答:大数据工程师,这个角色的核心职责在于洞察历史、预见未来以及优化决策。他们的工作重心在于"玩转数据",通过深入分析,揭示数据背后的秘密。首要任务是揭示历史事件的特征,通过对用户行为历史的挖掘,企业能更好地理解消费者,预测其可能的行为模式,从而提升服务和营销策略。其次,大数据工程师的预测能力不容...
  • 什么是大数据开发工程师
    答:大数据开发工程师的角色是关键的数据处理专家,他们的职责涵盖了从数据的初始获取,通过严谨的清洗和预处理,深入分析,到数据治理和挖掘的全过程。他们是技术研究的实践者,致力于将海量数据转化为有价值的商业洞察。这个专业领域被划分为三个等级:初级、中级和高级,每级都要求具备扎实的理论基础和实际操作...
  • 大数据工程师职业到底有多吃香?
    答:互联网、金融、电信、医疗、交通、民生,各行业都开始进行大数据应用,大数据的应用场景在未来更是有着无限可能。大数据工程师究竟是个啥神仙职位呢?先让我们来了解一下大数据是什么。大数据本质也是数据,但是又有了新的特征,包括数据来源广、数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件...
  • 大数据工程师做什么
    答:大数据工程师的核心职责在于挖掘数据价值,驱动业务前行。他们通过对历史数据的深度剖析,揭示出隐藏的模式和趋势,这对于企业洞察消费者行为至关重要。通过解析用户行为历史,工程师能精准描绘出用户画像,预测他们的行为动态,为企业提供决策依据。此外,大数据工程师还运用预测模型,预见市场动向和消费趋势,为...
  • 大数据工程师需要学习哪些
    答:1、大数据工程师做什么 数据工程师一个很重要的工作,就是通过分析数据来找出过去事件的特征。预测未来可能发生的事情,通过引入关键因素,大数据工程师可以预测未来的消费趋势 找出最优化的结果,根据不同企业的业务性质,大数据工程师可以通过数据分析来达到不同的目的。2、需要具有的能力 数学及统计学相关...
  • 什么是大数据软件工程师
    答:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产 大数据工程师是根据大数据来的一种职业
  • 大数据工程师做什么?
    答:大数据工程师做什么?需要具备什么能力?大数据是眼下非常时髦的技术名词,与此同时自然也催生出了一些与大数据处理相关的职业,通过对数据... 大数据工程师做什么?需要具备什么能力?大数据是眼下非常时髦的技术名词,与此同时自然也催生出了一些与大数据处理相关的职业,通过对数据 展开 ...