![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
spark ml 机器学习
游九河
每日需更进一步
展开
-
spark -- 线性回归
Apache Spark MLMLlib是Spark的机器学习(ML)库。其目标是使实用的机器学习可扩展且简单。从较高的层面来说,它提供了以下工具:ML算法:常见的学习算法,如分类,回归,聚类和协同过滤特征化:特征提取,转换,降维和选择管道:用于构建,评估和调整ML管道的工具持久性:保存和加载算法,模型和管道实用程序:线性代数,统计,数据处理等。线性回归在统计学中,线性回归(Lin...原创 2019-05-05 16:01:31 · 1299 阅读 · 0 评论 -
spark -- PCA
Spark PCA在机器学习或者数据挖掘中,得到的数据往往维度过高,含有噪音,需要把多指标转化为少数几个综合指标的数据。pca是机器学习框架中常用的一个功能,spark机器模块也实现了这一功能。PCA主要的几个方法设置输入项的字段def setInputCol(value: String): this.type = set(inputCol, value)设置输出项的字段def s...原创 2019-05-17 17:11:36 · 1150 阅读 · 0 评论