本篇谈一谈数据归一化,谈谈什么时候要使用数据归一化和数据归一化的作用,介绍数据归一化的方法(最值归一化和均值方差归一化)
1 数据归一化
机器学习算法中要求样本间的距离就要使用数据归一化,把数据映射到同一尺度。
数据归一化是为了解决量纲的问题,使数据映射到同一尺度。举2个例子:比如两个特征为月收入和和身高。月收入范围5000元-30000元,身高为1m-2.5m,在计算两个特征的欧式距离时,由于取值范围身高这一特征被忽略了,这样就让身高这一特征的信息失效了。所以要使用数据归一化把数据映射到同一尺度
2 最值归一化
适用于分布有明显边界(例如考试成绩)
3 均值方根归一化
结合代码感受下,快去动