【数据挖掘】数据样本的归一化处理方法

1、为什么要进行数据样本归一化?

        当我们对数据集进行处理和分析时,不同数据的比较需要进行包括量纲、量纲单位在内的各项内容进行数据统一标准化处理,以建立各类数据的可比性。量纲:物理量的基本属性。

2、数据归一化处理方法有哪些?

        min-max标准化、z-score标准化、log函数标准化、atan函数标准化等。

3、数据归一化处理方法

        min-max标准化方法是对原始数据的线性变换。设minA和maxA分别为属性A的最小值和最大值,将属性A的一个原始值V通过min-max标准化映射成在区间[new_minA,new_maxA]内的V'。转换公式为:

z = \frac{x_{i}-min(x_{i})}{max(x_{i})-min(x_{i})}

        min(x_{i})max(x_{i})分别为数据集中的最小值与最大值。

        z-score标准化方法需要用到数据集合的均值\mu、数据集合的标准差\sigma以及个体的观测值x,其转换公式如下:

z = \frac{x-\mu }{\sigma }

4、数据处理结果

 

各位朋友,文章若有任何问题,不吝赐教!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值