一、数据归一化的好处:
数据标准化和归一化的区别和联系:
在进行处理数据的时候,标准化的方法是比较多的,其中数据归一化是一种常见的数据的标准化,只不过标准化只是将数据进行规范到一个范围之内,对于数据的归一化来说,是将数据规范到0到1之间或者是-1到1之间。
在使用机器学习或者深度学习的模型的时候,数据预处理的阶段是十分重要的,我们在进行处理的时候,包括缺失值处理、异常值处理、重复值处理等很多方面,当然,数据标准化也是一个很重要的方面,数据标准化即将数据标准化到0到1之间,或者是-1到1之间。对于深度学习来说,这样可以使我们的数据和神经网络的激活函数处理之后的数据的取值的范围对应。
另外,关于归一化的好处,可以参考这个博客,讲的比较清楚:
http://blog.csdn.net/pipisorry/article/details/52247379
二、数据归一化的方法:
1、 最小最大值标准化 MinMaxScale,将数据规范到0-1之间
原理:
假设已知样本中的data为Xi,其中最小值和最大值分别为min和max,则在进行计算的时候,我们需要使用X_std =(Xi-min)/(max-min), 结果 = X_std* (max - min) +