【知识卡片】机器学习模型都需要标准化、归一化吗？什么时候不需要标准化、归一化

早起CaiCai

已于 2022-06-06 23:46:14 修改

阅读量1w

点赞数 8

分类专栏：机器学习 & 深度学习文章标签：机器学习人工智能决策树

于 2022-01-08 14:08:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45492560/article/details/122379567

版权

机器学习 & 深度学习专栏收录该内容

32 篇文章

订阅专栏

在这里插入图片描述

数据标准化、归一化都是特征工程中的特征放缩过程。

归一化
这样会将数据映射到 [0-1] 中

在这里插入图片描述

标准化
将数据的平均值降为0，标准差降为1
在这里插入图片描述

在这里插入图片描述

标准化和归一化详细也可参考：
标准化与归一化的详细知识

那机器学习都需要标准化吗？
需要标准化
机器学习中有部分模型是基于距离度量进行模型预测和分类的。由于距离对特征之间不同取值范围非常敏感，所以基于距离读量的模型是十分有必要做数据标准化处理的。
最典型基于距离度量的模型包括k近邻、kmeans聚类、感知机和SVM。
可以不用标准化（主要没有标签数据提供标准差数据）

另外，线性回归类的几个模型一般情况下也是需要做数据标准化处理的。
逻辑回归、决策树、基于决策树的Boosting和Bagging等集成学习模型对于特征取值大小并不敏感。所以这类模型一般不需要做数据标准化处理。另外有较多类别变量的数据也是不需要做标准化处理的。
（总结：线性回归类需要做标准化处理，而决策树（随机森林）对特征值大小不是很敏感，要好一点）

模型是否要标准化参考链接：
对于模型是否要标准化参考链接

博客等级

码龄6年

人工智能领域优质创作者

395
原创

1305
点赞

6131
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

matlab 功率谱分析
m0_71846371: 对于时域信号，可以使用功率谱密度（Power Spectral Density，PSD）来表示功率谱。功率谱密度的单位通常为信号原单位的平方，除以频率单位。例如，假设有一个时域信号，其原单位为伏特（V），频率单位为赫兹（Hz）。则该信号的功率谱单位为伏特平方（V^2）/赫兹（Hz）。如果使用功率谱密度（Power Spectral Density，PSD）来表示时域信号的功率谱，则功率谱密度的单位为信号原单位的平方，除以频率单位的平方。例如，假设有一个时域信号，其原单位为伏特（V），频率单位为赫兹（Hz）。则该信号的功率谱密度单位为伏特平方（V2次方）/赫兹平方（Hz^2）。这两个到底哪个正确啊？
数据可视化之美-动态图绘制（以Python为工具）
我爱鸢尾花: example 1实现的代码您这有吗
克里金插值（Kriging）在MATLAB中的实现【优化】
m0_69735761: 用循环
【五一创作】python序列数据处理【低通滤波】
早起CaiCai: 这里是低通的，滤掉10-30天是高通，Python应该有对应的函数
【五一创作】python序列数据处理【低通滤波】
Kemling3: 请问一下如果我是30天逐小时的数据，想要滤除10-30天波段的信号，也可以用这个函数进行处理吗

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

早起CaiCai 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。