Spark Mllib里如何将数值特征字段用StandardScaler进行标准化（图文详解）

最新推荐文章于 2021-08-28 23:47:18 发布

weixin_34343689

最新推荐文章于 2021-08-28 23:47:18 发布

阅读量267

点赞数

文章标签：大数据人工智能数据结构与算法

　　不多说，直接上干货！

　　首先，要明白为什么有时候，数值特征字段需要进行标准化？

　　答：因为，当我们若用回归分析算法时，必须将数值特征字段进行标准化，这是因为数值特征字段单位不同，数字差异很大，所以无法彼此比较，这时，就需要使用标准化，使得数值特征字段具有共同的标准。

　　加入数据标准化 withMean = false

　　具体，见

Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第14章使用逻辑回归二元分类算法来预测分类StumbleUpon数据集

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注