问题:
毕业了,找的工作不是太满意。听师兄说大数据这方向不错,准备学大数据,但不知道应该学Hadoop还是Spark。
Hadoop的话我有些Java基础,估计相对容易一些。
但据说Spark是趋势,可惜如何学Spark又得学新的Scala语言,毕竟不是老手,丢掉java学这个估计周期太长,纠结。
求老司机指导!
----------------------------------------------------------------------------------------------------------------------------------------------------------
回答:
从我们公司的情况来看,两个都要学。从招聘情况来看,Hadoop是必会,spark是最好会。所以,如果真想往大数据方向转,我的建议还是先学Hadoop,然后再进阶学spark。
三个原因:
1. hadoop 和 spark都发展很快,两者从设计之初目标就是一个互补的生态,并不是说谁要取代谁。所以最终两个都要会。
2. 学习spark最好有些hadoop的知识,至少目前hadoop是大数据的既定事实标准,spark要处理的数据大部分是在hadoop上,如HDFS、hive、hbase;还有spark standalone集群在生产上很少使用,一般都是将Spark应用程序发布在YARN或MESOS上。
3. 有java基础,从hadoop入手会更加顺利一些。