1、为什么要进行数据样本归一化?
当我们对数据集进行处理和分析时,不同数据的比较需要进行包括量纲、量纲单位在内的各项内容进行数据统一标准化处理,以建立各类数据的可比性。量纲:物理量的基本属性。
2、数据归一化处理方法有哪些?
min-max标准化、z-score标准化、log函数标准化、atan函数标准化等。
3、数据归一化处理方法
min-max标准化方法是对原始数据的线性变换。设minA和maxA分别为属性A的最小值和最大值,将属性A的一个原始值V通过min-max标准化映射成在区间[new_minA,new_maxA]内的V'。转换公式为:
和
分别为数据集中的最小值与最大值。
z-score标准化方法需要用到数据集合的均值、数据集合的标准差
以及个体的观测值x,其转换公式如下:
4、数据处理结果
各位朋友,文章若有任何问题,不吝赐教!