本系列”spark mllib机器学习”,均以最新spark2.3.0版本为蓝本进行编写,参考书籍<< spark mllib机器学习 >>黄美灵版,转载请注明出处
GitHub地址:https://github.com/future-fu/learnsparkmllib
目录
- 机器学习介绍
- spark介绍
- spark mllib介绍
明细
1.机器学习介绍
机器学习框架
机器学习分类
常见的机器学习算法如下:
- 分类与回归–线性回归,逻辑回归,贝叶斯分类,决策树分类
- 聚类–k-means,LDA主题,KNN
- 关联规则–Apriori,FPGrowth
- 推荐系统–协同过滤,ALS
- 神经网络–BP,SVM,RBF
- 深度神经网络–DNN,CNN
2.Spark介绍
spark简单说明一下,既然学到mllib,想必core ,sql, streaming都比较熟悉了;
mllib是机器学习库,里面提供各种各样的算法,可以用来在集群上针对分类,聚类,协同过滤进行计算;
GraphX是一个图计算库,用来处理图,执行基于图的并行操作,一般用的较少;
3.Spark Mllib介绍
☆┈━═┈━═┈━═┈━═┈━═☆因为您的赞赏,您会读到更多优质文章☆┈━═┈━═┈━═┈━═┈━═☆