解析「标准化 & 归一化」操作

标准化 & 归一化 是常见的数据处理方法,主要用途也都是特征缩放变换

更多标准化&归一化的讲解,大家可以前往 标准化和归一化什么区别?

归一化(Normalization):将数据变换到 某个固定区间中,通常是 [0,1]
归一化( min-max Normalization) = x i − x m i n x m a x − x m i n ( mean Normalization) = x i − m e a n ( x ) x m a x − x m i n \text{归一化( min-max Normalization)} =\frac{x_i-x_{min}}{x_{max}-x_{min}} \\ \quad \\ \qquad \qquad\text{( mean Normalization)} =\frac{x_i-mean(x)}{x_{max}-x_{min}} 归一化( min-max Normalization)=xmaxxminxixmin( mean Normalization)=xmaxxminximean(x)

标准化(Standardization) :将数据变换为均值为0,标准差为1 的分布「⚠️不一定是正态分布 ,标准化时,会改变 均值/标准差,但是 分布规律是不会改变的」随机变量 X X X服从期望为 μ \mu μ ,方差为 σ 2 \sigma ^{2} σ2的正态分布,记为 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μσ2)。当 μ = 0 , σ = 1 \mu = 0,\sigma = 1 μ=0,σ=1时为标准正态分布。
标准化(Standardization) = x i − μ σ \text{标准化(Standardization)}=\frac{x_i-\mu}{\sigma} 标准化(Standardization)=σxiμ
中心化:也称为零均值处理,就是将每个数据减去数据集的均值
中心化 = X i − X m e a n \text{中心化}=X_i - X_{mean} 中心化=XiXmean

缩放过程可以分为以下几种:

  1. 缩放到均值为0,方差为1(Standardization——StandardScaler())【z-score归一化】
  2. 缩放到0和1之间(Standardization——MinMaxScaler()) 【min-max归一化】
  3. 缩放到-1和1之间(Standardization——MaxAbsScaler())
  4. 缩放到0和1之间,保留原始数据的分布(Normalization——Normalizer())

在这里插入图片描述

⚠️!大家可以着重看下横坐标的变化

参考文章:标准化和归一化什么区别?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ViatorSun

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值