数据预处理----数据归一化

不同的评价标准往往具有不同的量纲和单位。在进行数据分析的时候,我们需要消除这些评价标准之间的影响,进行数据标准化,使得各个指标处于同一数量级。

两种形式

  1. 将数转化为(0,1)之间的小数,一般为min-max标准化,适用于有边界的训练集。
  2. 将数据无量纲化,一般为z-score标准化方法。

min-max标准化

对于每一个标准里的变量,我们减去标准中的最小值除以最大值减去最小值
x ^ = x − m i n m a x − m i n \hat{x} = \frac{x-min}{max-min} x^=maxminxmin

import numpy as np
import matplotlib.pyplot as plt

x = np.random.randint(0, 10, size=200)
x_std = (x - np.min(x)) / (np.max(x) - np.min(x))
plt.plot(x)
plt.plot(x_std)
plt.show()

在这里插入图片描述

z-score标准化方法

对于每一个标准里的变量,我们减去标准中的均值再除以标准差
x ^ = x − x ( m e a n ) x ( s t d ) \hat{x} = \frac{x - x(mean)}{x(std)} x^=x(std)xx(mean)

import numpy as np
import matplotlib.pyplot as plt

x = np.random.randint(0, 10, size=200)
z_score = (x - np.mean(x)) / (np.std(x))
plt.plot(x)
plt.plot(z_score)
plt.show()

在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值