数据标准化的常见方法(Min-Max标准化、Z-Score标准化等)

写在前面的话:

数据的标准化:

将数据按比例缩放,使之落入一个小的特定区间,一般目的在于:去除数据的单位限制,转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。数据的归一化便是一个典型的案例。

数据的归一化:

把数转换为(0,1)之间的小数
把有量纲的表达式转换为无量纲的表达式
归一化的好处:在多指标评价体系中,由于个评价指标的性质,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱值水平低指标的作用,因此,为了保证结果的可靠性,需要对原始数据进行标准化处理。

经验上来说,归一化就是让不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性。

1.1 数据标准化

Min-Max标准化
在这里插入图片描述

Min-Max标准化是指对原始数据进行线性变换,将值映射到[0,1]之间

Z-Score标准化
在这里插入图片描述

Z-Score标准化是指:基于原始数据的均值(mean)和标准差(standard deviation)来进行数据的标准化。其主要目的是将不同量级的数据统一化为同一个量级,统一用计算出的Z-Score值衡量,保证了数据间具有可比性。

小数定标(Decimal scaling)标准化
在这里插入图片描述

均值归一法(Mean normalization)

下图的 u是表示均值,value表示在一组数据中第i个元素的值

在这里插入图片描述

通过原始数据中的均值、最大值和最小值来进行数据标准化。(上述两条公式都是差不多的)

向量归一化
在这里插入图片描述
指数转换
指数转换是指:通过对原始数据进行相应的指数函数变换来进行数据的标准化。常见的指数转换函数方法如下所示:
在这里插入图片描述

参考:https://zhuanlan.zhihu.com/p/31635022
原文:https://blog.csdn.net/weixin_42792088/article/details/103971069

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值