数据标准化与归一化探索

本文探讨了数据标准化和归一化在机器学习中的重要性,包括提高模型精度、加速收敛速度。介绍了Z-score标准化和Min-Max缩放的适用场景,并指出在有异常值或考虑正则化时,标准化的优势更为明显。同时,文章指出在逻辑回归中,是否需要标准化取决于是否使用正则化,标准化还能帮助评估特征对样本标签的贡献度。
摘要由CSDN通过智能技术生成

About Feature Scaling and Normalization

对特征的标准化使得特征重新度量(rescaled)具有性质均值为 μ = 0 \mu=0 μ=0
以及标准方差为 σ = 1 \sigma=1 σ=1

变换的形式为:
z = x − μ σ z=\frac{x-\mu}{\sigma} z=σxμ
对特征进行标准化,使其以0为中心,标准差为1,这不仅在我们比较不同单位的测量值时很重要,而且也是很多机器学习算法的一般要求。

直观上,我们可以认为梯度下降是一个突出的例子(一种优化算法,常用于logistic回归,支持向量机,感知机,神经网络等);由于特征在不同的尺度上,某些权重可能比其他权重更新得更快,因为特征值 x j x_j xj在权重更新中起着重要作用

Δ w j

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值