Spark笔记
赵大寳Note
公众号:赵大寳Note(ID:StateOfTheArt),跟我一起探索世界
展开
-
分布式机器学习主要笔记
Mahout:机器学习Mahout是hadoop的一个机器学习库,主要的编程模型是MapReduce;每个企业的数据都是多样的和特别针对他们需求的。然而, 在对那些数据的分析种类上却没多少多样性。Mahout项目是实施普通分析计算的一个Hadoop库。用例包括用户协同过滤、用户建议、聚类和分类。MLlib:机器学习MLlib 运行在spark上(一个基于内存计算的框架), ...转载 2018-04-11 09:28:15 · 1919 阅读 · 0 评论 -
Spark实践笔记
Spark在Ubuntu下的安装参看: https://blog.csdn.net/u010412858/article/details/79076964#spark Spark中Scala shell的启动: 命令行直接输入:spark-shell,出现如下界面说明spark配置成功,可以进行Scala语言的交互使用 Spark中也支持Python,使用pyspark命令可以启动...原创 2018-05-26 22:04:25 · 196 阅读 · 0 评论