数据预处理--特征归一化

最新推荐文章于 2024-05-03 22:05:55 发布

玄荣。

最新推荐文章于 2024-05-03 22:05:55 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习文章标签：数据预处理归一化特征

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pangxuanrong/article/details/89522085

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

为什么需要对数值类型的特征归一化？

对数据进行特征归一化（Normalization）处理，可以使得数据的各个特征处于同一数值量级，而不会导致模型学习出来的结果倾向于数值差别比较大的那些特征。

常用的特征归一化方法：

线性函数归一化（Min-Max Scaling）：对原始数据进行线性变换，是结果映射到[0,1]范围，实现对原始数据的等比缩放。归一化公式为：x_norm=(x-x_min)/(x_max-x_min)
零均值归一化（Z-Score Normalization）：将原始数据映射到均值为0、标准差为1的分布上。我们假设原始特征的均值为μ、标准差为σ，则归一化公式为：x_norm = (x-μ)/σ

通常在实际应用中，通过梯度下降求解的模型是需要归一化的，包括线性回归、逻辑回归、支持向量机、神经网络模型等。然而并不适用于决策树模型，因为决策树在划分子树时依据的是信息增益（或基尼系数等），而信息增益与特征是否经过归一化是无关的，因为归一化并不会改变样本在特征上的信息增益。

Reference：《百面机器学习》

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
数据预处理--特征归一化

为什么需要对数值类型的特征归一化？对数据进行特征归一化（Normalization）处理，可以使得数据的各个特征处于同一数值量级，而不会导致模型学习出来的结果倾向于数值差别比较大的那些特征。常用的特征归一化方法：线性函数归一化（Min-Max Scaling）：对原始数据进行线性变换，是结果映射到[0,1]范围，实现对原始数据的等比缩放。归一化公式为：x_norm=(x-x_min)/(...
复制链接

扫一扫

专栏目录

博客等级

码龄5年

1
原创

1
点赞

2
收藏

0
粉丝

关注

私信

热门文章

数据预处理--特征归一化 1100

分类专栏

机器学习 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。