特征归一化（特征缩放）的常用方法

最新推荐文章于 2023-11-06 20:43:14 发布

偶然is

最新推荐文章于 2023-11-06 20:43:14 发布

阅读量3.1k

点赞数 3

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36455412/article/details/117792545

版权

1.为什么要归一化

为了消除特征间单位和尺度差异的影响，需要进行数据标准化处理，以对每维特征同等看待。比如身高和体重，房屋面积和卧室数（例如房屋面积在0-200之间，卧室数量在1-5之间，数字不在一个量纲上）
能提高梯度下降法求解最优解的速度（收敛所需的迭代次数更少）
如左图是没有经特征归一化的代价函数J(θ)的等值线，右边是经过特征归一化的等值线，可以看出左图呈现出歪斜并且椭圆的形状，如果在这种代价函数上做梯度下降，可能需要较长的时间，才能到达全局最小值。反之，在右图收敛至最小值中心较短。
总之，归一化的目的就是使得预处理的数据被限定在一定的范围内（比如[0,1]或者[-1,1]）,从而消除奇异样本数据导致的不良影响。

2.归一化方法有哪些

2.1线性函数的归一化
线性函数归一化也称为“最大最小值归一化”，对原始数据做线性的变换，使得结果分布在[0,1]的范围上，公式为：

特点：异常值会对结果造成偏差
2.2零均值归一化

首先求出样本的均值:μ=(x1+x2+⋯+xn)/n
再求出样本的标准差，即样本的值减去平均值的平方和:

变换后的样本z=(x-μ)/σ
选择某一个归一化方法后，在训练集、测试集、新样本上同样都要用相同的方法进行归一化处理

3.哪些算法要做特征归一化

线性回归
逻辑回归
支持向量机
神经网络
决策树一般不需要归一化，它注重的是信息增益或者信息增益率或者Gini指数

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
特征归一化（特征缩放）的常用方法

1.线性函数的归一化线性函数归一化也称为“最大最小值归一化”，对原始数据做线性的变换，使得结果分布在[0,1]的范围上，公式为：特点：异常值会对结果造成偏差2.零均值归一化首先求出一组变量的均值...
复制链接

扫一扫

偶然is CSDN认证博客专家 CSDN认证企业博客

码龄8年

13: 原创

73万+: 周排名

140万+: 总排名

8万+: 访问

: 等级

313: 积分

21: 粉丝

146: 获赞

52: 评论

471: 收藏

私信

关注

热门文章

分类专栏

思科路由技术 1篇

最新评论

改变conda虚拟环境的默认路径
偶然is: 别删除
改变conda虚拟环境的默认路径
2301_81861337: 博主，更改完路径，C盘里的 .conda文件可以删除吗，需要我手动把这些文件剪切过去后来设置的路径，它会自动生成
Telnet和SSH远程登录--Cisco
CSDN-Ada助手: 恭喜您写了第14篇博客！标题看起来很有吸引力，我对Telnet和SSH远程登录的内容非常感兴趣。感谢您分享这些有关Cisco的知识，这对我来说非常有帮助。希望您能继续坚持创作，分享更多关于网络安全和远程登录的主题。如果可能的话，我希望您能在未来的博客中提供一些实际案例，以及如何解决可能出现的问题。再次感谢您的分享，期待您的下一篇博客！
改变conda虚拟环境的默认路径
WRMFWLXL: 安装好了，谢谢博主
改变conda虚拟环境的默认路径
忺九: 我也是找不到

大家在看

冒泡排序，qsort的使用与构造 4

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。