先前一直在纠结Standardization(标准化)和Normalization(归一化)的区别,后来参考了知乎(https://www.zhihu.com/question/20467170)的一篇文章才终于弄懂。
其实Standardization和Normalization在不同的领域是有不同的定义的,一直以来弄不清楚的原因也是因为混用了,现在从统计学、机器学习、sklearn的preprocessing模块3个方面来区分,参考资料为:
统计学:https://en.wikipedia.org/wiki/Normalization_(statistics)
机器学习:https://en.wikipedia.org/wiki/Feature_scaling
sklearn的preprocessing:
因为Normalization有几个意思,为方便,在本文,统一把Normalization翻译为归一化,Standardization翻译为标准化。
从统计学上:
在统计学上没有Standardization,只有Normalization,不管是把数据变为均值为0,方差为1的正态分布,还是把