去量纲、数据归一化

1、去量纲

指是去除数据单位之间的不统一,将数据统一变换为无单位(统一单位)的数据集,也可以作为指标的权重,进行后续的加权计算。

2、数据归一化

数据分标准化是将数据按比例缩放,使之落入一个小的特定区间,在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

A、对一维数据的缩放有如下定义:

0-1归一化(normalization):(Xi-Xmax)/(Xmax-Xmin)

标准化(standardization):(Xi-均值)/方差

B、0-1归一化和标准化的本质:缩放和平移。线性变化得性质:线性变化不会改变原始数据的数值排序

C、0-1归一化和标准化的区别:

0-1归一化的缩放时拍扁统一到区间(仅由极值决定);标准化的缩放是更加弹性和动态的,和整体样本的分布有很大的关系。

0-1归一化:缩放仅仅跟最大和最小值得差别有关(输出范围在0-1)

标准化:缩放和每个点都有关系,通过方差体现出来。与归一化对比,标准化中所有数据点都有贡献(通过均值和标准差造成影响)。(输出范围在负无穷到正无穷)

D、0-1归一化和标准化使用情况:

如果对输出数据结果范围有要求,用归一化;

如果数据较为稳定,不存在极端的最大最小值,用归一化;

如果数据存在异常值和较多噪音,用标准化,可以间接通过中心化避免异常值和极端值得影响。

E、归一化的好处:

提升模型的收敛速度;提升模型的精度

F、常见的数据归一化方法

0-1归一化;log函数转换(通过以10为底的log函数转化的方法实现归一化);atan函数转换(反正切函数)
————————————————
版权声明:本文为CSDN博主「努力努力MT」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ab19920904/article/details/80093549

  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值