日攻一卒 ---机器学习中 标准化和归一化的区别?

归一化和标准化是机器学习中重要的预处理步骤,用于调整特征的尺度。归一化通过缩放数据到[0,1]或[-1,1]范围,确保特征同等重要;而标准化则使数据符合均值0,方差1的分布,减少离群值影响。这两种方法都有助于改善模型训练和预测效果。
摘要由CSDN通过智能技术生成

归一化

是什么?

在机器学习中, 归一化是一个重要的预处理步骤,归一化可以将所有的特征放到相同的尺度, 以确保他们具有相同的重要性。

为什么?

因为不同的特征之间的单位(量纲)可能不同,导致某些特征对模型的训练和预测产生更大的影响。

怎么实现?

具体来说,归一化的目的是将数据的值域缩放到一个固定的范围内, 通常是【0,1】或者【-1, 1】。这种缩放可以通过以下公式实现:
x n o r m = x − x m i n x m a x − x m i n x_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}} xnorm=xmaxxminxxmin

其中 x 是原始数据, x _min 和x_max是最大值, x_norm是经过归一化的数据。

标准化

是什么?

在机器学习中,标准化是一种常用的数据预处理方法,与归一化不同,标准化是一种基于特征的统计量,例如均值和标准差, 来缩放数据的方法。 标准化可以将数据转化为均值为0、方差为1的分布,这有助于减少离群值的影响,

为什么?

他的目的是将数据缩放到相同的尺度,去除异常值的影响,以便于模型的训练和优化。

怎么实现?

标准化的公式为:
x s t d = x − μ σ x_{std} = \frac{x - \mu}{\sigma} xstd=σxμ

因此,归一化和标准化的主要区别在于他们所使用的缩放方法不同。
归一化可以确保数据在相同的尺度上,而标准化可以确保数据具有相同的分布。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值