主要是读了这篇文章才深入理解这两个的区别
http://www.zhaokv.com/2016/01/normalization-and-standardization.html
归一化
对原始数据进行线性转换到 [0,1] 区间,如下:最小值和最大值特别容易受异常值影响,因此鲁棒性不好,比较适合传统的小数据场景
标准化
最常用的方法是Z-score标准化,即将数据转化成均值为0,标准差为1,处理方法如下:其中
是样本的均值,
是样本的标准差,适合已有的样本量足够大的时候使用。
理论解释
归一化的依据非常简单,归一化可以消除量纲对结果的影响,使不同变量有可比性。标准化的依据相对复杂,它表示原始值和均值之间差几个标准差,是一个相对值&#