数据标准化处理方法_[CPDA考点]数据分析基础常用的数据标准化方法

736a8fbdc5fd75308b7341935f54b0db.png

数据标准化,是对数据进行无量纲化的处理,即去除数据的度量单位。

1 基本原理:

在进行多指标研究分析时,由于多指标的度量不一致,其数据间的差值也会过大,如果直接用原始数据进行研究分析,则会导致结果呈现偏向(偏高或偏低作用),因此为了保证结果呈现真实的规律,需要对多指标进行数据标准化处理。

常用的数据标准化方法有:Z-Score标准化(Z得分)、最大最小值标准化和归一化标准化等。

2 融入方法论

(1)如果指标数据集中存在异常值、不知道最大最小值、超出取值范围的离群值,则通过Z得分进行数据标准化。

(2)如果已知数据集的最大最小值(确认不会变化),则会通过最大最小值进行数据标准化。

(3)如果需要进行数据标准化的同时计算权重,则会通过归一化进行数据标准化。

3 公式:

(1)Z得分:

标准化数据=(原始值-均值)/标准差

(2)最大最小值:

标准化数据=(原始值-最小值)/(最大值-最小值)

(3)归一化:

aa58e8515f2483ac20d8af5ff2344df2.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值