python 大数据开发工程师_大数据系列之大数据开发工程师

继续介绍大数据系列岗位的要求,今天是“最热门”的岗位大数据开发工程师,之所以说热门主要是基于2个原因,一是因为很多应届生或者想转入大数据行业的同学,都是期望从事“大数据开发”这一定位不是很清晰的岗位;二是因为至少有3个岗位可以称为“大数据开发”,所以这里的“最热门”需要详细分析。老套路先从几个大厂的岗位要求说起。

今日头条

1、本科以上学历,软件工程/计算机/通信/数学等相关专业;

2、熟悉Hive SQL语言,熟悉shell, python等至少一种脚本语言;

3、有hadoop、spark、flink等至少一种大数据平台的使用经验;

4、理解能力强,善于沟通,有责任心和团队精神;

5、有数据仓库建设、商业数据分析、增长项目经验者优先。

有赞

1、java/scala至少熟练使用一种

2、具备扎实的计算机理论基础, 对数据结构及算法有较强的功底

3、熟悉至少一种实时计算引擎 Storm, Spark Streaming, Flink, 对hadoop生态其他组件有一定了解,比如 HBase, hadoop, Hive, Druid等

4、有大规模集群应用开发经验优先

5、有BAT工作经验优先

6、具备良好工作习惯和团队协作精神

华为

1、计算机或相关专业本科及以上学历,对数据处理、数据建模、数据分析等有深刻认识和实战经验;

2、熟悉Hadoop/Spark/Hive/HBase等大数据工具,主导过大型数据平台建设者优先;

3、精通SQL,熟悉常用的关系型数据库、非关系性数据库和数据仓库,具有SQL性能优化经验;

4、了解微服务开发理念、实现技术,熟悉常见设计模式,熟练掌握SSH开发框架,熟练进行Java、Python代码编写,熟悉多线程编程;

5、思维敏捷,对新技术敏感,有较强的钻研学习能力;

蚂蚁金服

1、三年以上工作经验,有大型互联网行业从业经验

2、有Hadoop/Hive/Spark/Storm/Zookeeper 等相关开发经验或从事分布式相关系统的开发工作

3、熟悉Linux/Unix系统和丰富的Java开发经验

4、具有强烈的责任心,求知欲望强

小影

1、本科及以上学历,计算机相关专业

2、3年以上企业级数据仓库开发经验

3、熟悉数据仓库理论,具备复杂业务需求梳理能力

4、熟练SQL开发,精通Mysql等关系型数据库中的一种或几种

5、熟练掌握Hadoop及Map-Reduce应用开发,熟练掌握HBase、Hive、Storm、spark等大数据开发工具中一种或几种

6、熟悉Linux系统,具备shell、python等脚本开发能力者优先

7、学习能力强,喜欢研究开源新技术,有团队观念,具备独立解决问题的能力

能力三核模型分析

大数据开发工程师.png

综合结果如下

知识

1、本科及以上学历(3)

2、计算机相关专业(4)

硬技能

1、熟练掌握hadoop、Hbase、Hive、Storm、Spark Streaming、flink等大数据开发工具中一种或几种(5)

2、熟悉shell、python、scala、java等至少一种开发语言(5)

3、熟悉linux/unix系统(2)

4、有数据仓库建设、数据处理、数据建模、数据分析相关经验(2)

5、精通sql,熟悉常用的关系型数据库和非关系型数据库(1)

才干or 软技能

1、良好的团队精神(3)

2、较强的学习能力和欲望(3)

3、强烈的责任心(2)

4、独立解决问题能力(1)

分析

从上面硬技能来看,同时具备1,2,3项不是很难,这个都是程序开发的范畴,但是要和4,5两个条件同时具备这个就非常难了,这是明显的两个职位。所以需要先看一下工作职责和内容

岗位职责

1、负责数据仓库建设、ETL开发、数据分析(3)

2、负责数据指标统计(2)

3、负责大数据实时计算平台及业务开发(1)

4、负责大数据平台建设及维护(2)

通过上面4项总结后的岗位职责可以看出,1、2两项职责是针对数据仓库岗位要求,也就是前面系列文章大数据岗位要求之数据仓库所介绍内容;第3项岗位职责主要是对应第一项hadoop生态体系硬技能要求的,主要是在实时计算及二次开发方面;第4项岗位要求是大数据平台工具的开发,一般包括开发平台、调度系统、元数据平台等工具,主要对应java等语言开发能力要求。

个人经验

通过上述分析可以知道数据仓库开发、实时计算开发、大数据平台开发一般都会被称作大数据开发,其实这是3个岗位,各自要求也不尽相同。希望对应届生同学或者想转入大数据行业的同学有所帮助。

延伸一下hadoop生态体系太庞大了,包括但不限于hdfs、hive、hbase、storm、spark、flink、kafka、flume等,所以作为一个优秀的大数据开发,尤其是大数据运维同学的学习能力的要求是非常高的。在非大数据同学看来这些都是大数据同学应该掌握的,并且在一般公司招聘时也不会每个系统招一个人,也都是综合要求,这样大神或者架构师市面上还是有的,只是太少了,所以大数据开发的薪酬待遇高也是有道理的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python大数据开发是指使用Python编程语言进行大数据处理和分析的开发工作。Python在数据科学领域非常流行,拥有丰富的库和框架,特别适用于数据分析和机器学习任务。通过这些库和框架,开发人员可以方便地处理大规模的数据集,并进行各种复杂的数据分析和挖掘操作。 要进行Python大数据开发,首先需要搭建Python环境。可以通过安装Python解释器来开始Python开发工作。安装Python后,就可以使用Python的各种库和框架来进行大数据处理和分析。同时,在学习Python大数据开发时,可以按照基础学习课程的内容进行学习,包括搭建环境、学习基本的语法和数据类型、掌握函数和文件操作等知识。在掌握了Python的基础知识之后,可以进一步学习面向对象编程和深入的大数据处理技术,如使用Python进行数据分析和机器学习等。 总之,Python大数据开发是利用Python编程语言进行大数据处理和分析的工作。它通过Python的丰富库和框架,为开发人员提供了便捷的大数据处理和分析工具,使Python成为最受欢迎的大数据开发语言之一。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [用Python大数据,都需要学什么?](https://blog.csdn.net/libaiup/article/details/129582414)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Python + 大数据 阶段一 Python大数据开发基础 第一章 大数据介绍及开发环境 1-1 大数据介绍](https://blog.csdn.net/weixin_44226181/article/details/130802149)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值