相信现在很多做IT行业的大佬多多少少都了解或者听说过大数据这个越来越火的名词,也有很多人想往大数据这边发展。
但是接触了就会发现其实大数据很广泛,相信大家都一样,刚刚接触大数据的时候完全一头雾水,不知道该往那方面发展,怎么开始进军大数据这个行业?
对于零基础的朋友,一开始入门可能不会太简单。因为需要掌握一门计算机的编程语言,大家都知道计算机编程语言有很多,比如:R,C++,JAVA,Python 等等。
只要你掌握一定的编程语言之后,一般就可以进行大数据部分的基础学习了。
大数据技术入门基础总的来说有四大块:Hadoop基础,离线数据处理,实时数据处理,ETL与环境 这四大块都是在大数据项目实战中是会经常使用到的。
Hadoop基础:
1,分布式储存基石:HDFS
2,分布式计算基础:MapReduce
3,Hadoop集群资源管家:YARN
YARN
离线数据处理
1,离线日志收集利器:Flume
2,离线批处理必备工具:Hive
v
3,速度更快的Hive:Impala
I
4,更快更强更好用的MR:Spark
实时数据处理
1,流数据集成神器:kafka
2,实时计算引擎:spark streaming
3,海量数据高速存取数据库:HBase
ETL与环境相关
1,ELT神器:Sqooq,Kettle
2,任务调度双量:Oozie,Azkaaban
Linux,Hadoop,Scala, HBase, Hive, Spark 等等专业知识点,是大数据项目中都会使用到的。如果要完整的学习大数据的话,这些知识点都是必不可少的!
上面这些基础的知识点,我这里有一些资料可以免费分享给大家
上面这些基础的知识点,我这里有一些资料可以免费分享给大家
有兴趣学习大数据的伙伴们,可以我们一起学习交流讨论,有资料大家一起分享,共同进军大数据这个行业,大家在学习大数据方面总会遇到一些问题,我这里给大家介绍一个有很多大佬会帮忙解决问题的学习交流群,这些资料也是在群里免费领取的呢,