1.为什么需要对数值类型的特征做归一化？

最新推荐文章于 2024-04-02 21:20:01 发布

光英的记忆

最新推荐文章于 2024-04-02 21:20:01 发布

阅读量1.7k

点赞数 1

分类专栏：算法文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29678299/article/details/88659616

版权

算法专栏收录该内容

34 篇文章 2 订阅

订阅专栏

对数值类型的特征做归一化可以将所以的特征都统一到一个大致相等的数值区间内。

比如x1的范围是[0,10]，x2的范围是[0,100]。两者的量纲是不等的，可想而知相比于x1，x2需要更多的迭代步数才能收敛到最佳值，从而使最后的结果更青睐于x2特征。
而当归一化后，x1，x2的量纲相等，不仅能减少迭代步数，还能使两种特征对最后的结果影响相同。

最常用的方法有2种

（1）线性函数归一化：

对原始数据进行线性变换，使结果映射到【0，1】的范围，实现对原始数据的等比缩放。

$Xnorm=\frac{X-Xmin}{Xmax-Xmin}$

X为输入数据，其他分别是最大值最小值输出结果，结果就是把所有X 的值等比线性换算到[0,1]区间

(2)零均值归一化：

·把数据映射到均值为0，标准差为1的分布上。具体来说，假设原始特征的均值为u,标准差为 $\delta$ ，那么归一化公式

$z=\frac{x-u}{\delta }$

标准差：所有数减去平均值，它的平方和除以数的个数（或个数减一)，再把所得值开根号，就是1/2次方，得到的数就是这组数的标准差。

在实际应用中，通过梯度下降法求解的模型通常需要归一化的，包括线性回归，逻辑回归，支持向量机，神经网络等模型。

但是对于决策树模型则并不适用，决策树在进行节点分裂时主要依据数据集关于特征X的信息增益比，而信息增益比跟特征是否经过归一化是无关的，因为归一化并不能改变样本在特征X上的信息增益。

光英的记忆

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
1.为什么需要对数值类型的特征做归一化？

对数值类型的特征做归一化可以将所以的特征都统一到一个大致相等的数值区间内。比如x1的范围是[0,10]，x2的范围是[0,100]。两者的量纲是不等的，可想而知相比于x1，x2需要更多的迭代步数才能收敛到最佳值，从而使最后的结果更青睐于x2特征。而当归一化后，x1，x2的量纲相等，不仅能减少迭代步数，还能使两种特征对最后的结果影响相同。最常用的方法有2种（1）线性函数归一化：...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。