我是学Java的,想尝试大数据和数据挖掘,该怎么规划学习?

我是学Java的,想尝试大数据和数据挖掘,该怎么规划学习?

学习过Java之后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手
1.大数据开发工程师,这个比较适合刚刚从Java转换过来的人员做,主要学习HDFS,MapReduce,Yarn,Hive,Flume,Sqoop,Spark等技术即可转转型。
2.数仓工程师:这个需要SQL基础好一些,其他环境配置基本上公司已经完成,主要是针对Hive方向的开发和数据仓库的建模擦操作
3.实时工程师:这个主要针对的是Spark部分,SparkStreaming是老牌的实时处理,相对公司使用还是比较多的,近年来阿里收购了Flink之后,加速了Flink在国内的步伐,所以这个flink最好也要学习,Storm就可以适当的了解
4.数据挖掘:需要学习完成大数据体系,也就是大数据开发工程需要学习的,除了这些外要学会 机器学习R语言主要是为了统计分析和绘图,在Hadoop生态圈中是有自己的机器学习库的mahout提供可扩展的机器学习领域经典算法的实现,包括聚类、分类、推荐过滤、频繁子项挖掘等,且可通过Hadoop扩展,但是鉴于MapReduce的性能,建议学习Spark MLlib: MLlib是Spark是常用的机器学习算法的实现库,支持二元分类,回归,聚类以及协同过滤等算法。同时也包括一个底层的梯度下降优化基础算法。除了之外,也可以学系python,python中也有一套完整的机器学习库。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值