成为一个大数据开发工程师的学习步骤？

最新推荐文章于 2024-09-25 09:03:37 发布

铁拳虎

最新推荐文章于 2024-09-25 09:03:37 发布

阅读量1.1k

点赞数 2

分类专栏：大数据学习大数据开发大数据入门数据分析 Hadoop Kafka 大数据大数据技术人工智能 spark Linux 文章标签：大数据大数据学习大数据开发大数据入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/juan189/article/details/87827575

版权

大数据学习同时被 3 个专栏收录

115 篇文章 14 订阅

订阅专栏

大数据入门

115 篇文章 3 订阅

订阅专栏

115 篇文章 0 订阅

订阅专栏

本文介绍了成为大数据开发工程师的学习步骤，从认识大数据的特性到掌握必要的技能，包括Python、Scala、Hadoop生态系统组件、Linux、Java高级知识等。同时提到了学习规划，分为基础、攻坚和辅助工具学习三个阶段。

摘要由CSDN通过智能技术生成

大数据的学习是有条件限制的，首先你需要是一名普通的工程师，如果你是Java工程师的话更好，但如果你是小白的话，那就只能成为一名工程师的后再来学习大数据。

一、认识大数据

大数据本质其实也是数据，不过也包括了些新的特征，

数据来源广；
数据格式多样化（结构化数据、非结构化数据、Excel文件等）；
数据量大（最少也是TB级别的、甚至可能是PB级别）；
数据增长速度快。

而针对以上新的特征需要考虑很多问题：

例如，数据来源广，该如何采集汇总？采集汇总之后，又该存储呢？数据存储之后，该如何通过运算转化成自己想要的结果呢？

对于这些问题，我们需要有相对应的知识解决。

二、大数据所需技能要求

Python语言：编写一些脚本时会用到。

Scala语言：编写Spark程序的最佳语言，当然也可以选择用Python。

Ozzie，azkaban：定时任务调度的工具。

Hue，Zepplin：图形化任务执行管理，结果查看工具。

Allluxio，Kylin等：通过对存储的数据进行预处理，加快运算速度的工具。

互联网科技发展蓬勃兴起，人工智能时代来临，抓住下一个风口。为帮助那些往想互联网方向转行想学习，却
因为时间不够，资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程，大数据学习
群：199加上【427】最后加上210就可以找到组织学习欢迎进阶中和进想深入大数据的小伙伴加入。

必须掌握的技能：

Java高级(虚拟机、并发)、Linux 基本操作、Hadoop（HDFS+MapReduce+Yarn ）、 HBase（JavaAPI操作+Phoenix ）、Hive(Hql基本操作和原理理解）、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ）、辅助小工具(Sqoop/Flume/Oozie/Hue等)

高阶技能6条：机器学习算法以及mahout库加MLlib、 R语言、Lambda 架构、Kappa架构、Kylin、Alluxio

三、学习规划

第一阶段（基础阶段）

Linux学习
Linux操作系统介绍与安装、Linux常用命令、Linux常用软件安装、Linux网络、防火墙、Shell编程等。
Java 高级学习（《深入理解Java虚拟机》、《Java高并发实战》）
掌握多线程、掌握并发包下的队列、掌握JVM技术、掌握反射和动态代理、了解JMS。
Zookeeper学习
Zookeeper分布式协调服务介绍、Zookeeper集群的安装部署、Zookeeper数据结构、命令。

第二阶段（攻坚阶段）

Hadoop、Hive、HBase、Scala、Spark、Python

第三阶段（辅助工具工学习阶段）

Sqoop、Flume、Oozie、Hue这些工具的学习

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。