Spark Mllib机器学习库
一共有六大类,有12个算法
一、回归算法
1.线性回归
数据输入格式:(1)、 “标签,特征值1 特征值2 特征值3 特征值4 .....”
(2)、 “标签 特征值ID:特征值 特征值ID2:特征值......”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
2.逻辑回归
数据输入格式:(1)、“标签 特征值ID:特征值 特征值ID2:特征值......”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
3.保序回归
数据输入格式:”标签,特征值”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
二、分类算法
1.贝叶斯分类
数据输入格式:”类别,特征值1 特征值2 特征值3......”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
2.SVM算法
数据输入格式:“标签 特征值ID:特征值 特征值ID2:特征值......”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
3.决策树算法
数据输入格式:”标签 特征值1 特征值2 特征值3......”
数据输出格式:
(预测1,标签1)
(预测2,标签2)
...
三、聚类算法
1.KMean
数据输入格式:“特征1 特征2”
数据输出格式:
聚类中心点
2.主题模型算法
四、关联规则挖掘算法
1.FP关联规则算法
五、推荐算法
1.ALS交替最小二乘法
2.协同过滤算法
六、神经网络算法
1.神经网络算法