使用spark ML创建机器学习流水线,ml包和mllib包的区别
使用spark ML创建机器学习流水线,ml包和mllib包的区别spark中ml包和mllib包的区别
mllib,主要针对RDD
ml,主要针对dataSet
- 建议使用ml,它比mllib新,而且dataSet可用spark SQL操作,比较灵活.
下面是一个机器学习的Demo,使用DataFrame作为数据集package edu.zhku.mllib.baseimport org.a
原创
2018-04-30 23:31:45 ·
865 阅读 ·
0 评论