1、去量纲
指是去除数据单位之间的不统一,将数据统一变换为无单位(统一单位)的数据集,也可以作为指标的权重,进行后续的加权计算。
2、数据归一化
数据分标准化是将数据按比例缩放,使之落入一个小的特定区间,在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
A、对一维数据的缩放有如下定义:
0-1归一化(normalization):(Xi-Xmax)/(Xmax-Xmin)
标准化(standardization):(Xi-均值)/方差
B、0-1归一化和标准化的本质:缩放和平移。线性变化得性质:线性变化不会改变原始数据的数值排序
C、0-1归一化和标准化的区别:
0-1归一化的缩放时拍扁统一到区间(仅由极值决定);标准化的缩放是更加弹性和动态的,和整体样本的分布有很大的关系。
0-1归一化:缩放仅仅跟最大和最小值得差别有关(输出范围在0-1)
标准化:缩放和每个点都有关系,通过方差体现出来。与归一化对比,标准化中所有数据点都有贡献(通过均值和标准差造成影响)。(输出范围在负无穷到正无穷)
D、0-1归一化和标准化使用情况:
如果对输出数据结果范围有要求,用归一化;
如果数据较为稳定,不存在极端的最大最小值,用归一化;
如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值得影响。
E、归一化的好处:
提升模型的收敛速度;提升模型的精度
F、常见的数据归一化方法
0-1归一化;log函数转换(通过以10为底的log函数转化的方法实现归一化);atan函数转换(反正切函数)
————————————————
版权声明:本文为CSDN博主「努力努力MT」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ab19920904/article/details/80093549