问题引入
在我们做机器学习相关的研究时,尤其在进行数据处理的过程中,大大小小都会遇到标准化和归一化的相关概念和处理,为什么需要归一化在上节课中我们以及讨论过了,这里说下标准化和归一化到底有什么区别呢?
问题解答
首先看一下标准化和归一化的公式:
归一化
标准化
归一化和标准化的区别:归一化是将样本的特征值转换到同一量纲下把数据映射到[0,1]或者[-1, 1]区间内,仅由变量的极值决定,因区间放缩法是归一化的一种。标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,转换为标准正态分布,和整体样本分布相关,每个样本点都能对标准化产生影响。它们的相同点在于都能取消由于量纲不同引起的误差;都是一种线性变换,都是对向量X按照比例压缩再进行平移。
拓展
除了归一化和标准化之外,还有中心化,这个比较好理解,其实也就是将数据的mean变成0.一般来说,工程上优先使用标准化,然后再归一化,那这又是为什么呢?
欢迎关注公众号“百面机器学习”,也欢迎提出新的问题和总结~~
参考
https://www. jianshu.com/p/95a8f035c 86c https://www. zhihu.com/question/2045 5227/answer/370658612 https:// blog.csdn.net/uestc_c2_ 403/article/details/75804617