大数据学习路线
先看一个学习大数据要涉及到的一些技术,
第一点是Java(Java SE,javaweb)
在大数据中,有个核心技术是Hadoop, Hadoop主要完成数据的存储与计算,技术包括HDFS和MapReduce, 而要编写HDFS和MapReduce,则需要用到Java语言。
第二点是 Linux(shell,高并发架构,lucene,solr)
大数据的底层是Linux系统,如果你不会Linux连个服务器都不了解,怎么能够学会大数据呢?所以如果想要学习大数据Linux是必须的。有一点需要注意的是只要掌握Linux的核心命令就可以了,关于运维方面的知识做到了解就好。
第三点是Hadoop(HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)
Hadoop是大数据的核心技术,包括HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume等技术,只要把Hadoop学会了,上岗就业也就没有问题了,这部分是重点,需要大家好好掌握。
第四点是机器学习(R,mahout)
机器学习主要是包括一些算法,通过这些算法来完成数据的分析,比如线性回归、逻辑回归等,机器学习属于大数据的核心底层,如果机器学习学好了,可以做算法工程师。
第五点是Storm(Storm,kafka,redis)
Storm是做流失处理的,不是必须要学习的。
第