六、机器学习基础知识：数据归一化

七层楼的疯子

已于 2023-11-25 16:10:38 修改

阅读量941

点赞数 4

分类专栏：机器学习（Python）文章标签：机器学习人工智能深度学习数据挖掘数据分析

于 2023-05-08 17:00:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42051846/article/details/130441924

版权

本文介绍了机器学习中数据归一化的必要性，包括最大最小归一化和Z-score标准化两种常见方法，并探讨了它们在不同场景下的应用选择。归一化能够解决特征尺度差异问题，提高模型训练效果。

摘要由CSDN通过智能技术生成

文章目录

归一化的原因

归一化的原因

在进行机器学习训练时，通常一个数据集中包含多个不同的特征，例如在土壤重金属数据集中，每一个样本代表一个采样点，其包含的特征有经度、纬度、海拔、不同重金属含量等，这些特征所使用的量纲存在较大的区别，进而导致不同特征下的数值之间的差别也较大。在使用此数据集进行实验时，极有可能忽略了某些数值变化区间较小的特征指标对目标特征数据的影响，进而直接影响到实验的结果。
归一化前的数据：
在这里插入图片描述

为了解决上述问题，在使用该数据集进行相关实验前，通常需要使用归一化方法对数据进行预处理。归一化方法是机器学习中的一项基础工作，可以被通俗的理解为将不同的数据归为同一类。归一化方法有两种形式，一种为通过数学方法将所有的数据映射到0到1范围之内来方便进行处理，另外还有一种方式是将有量纲表达式变为无量纲表达式。由于在进行机器学习时，大部分情况都是将所有的数据映射到0到1范围之内即可，因此将分别针对这一形式中的几种归一化方法进行介绍。
归一化之后的数据：
在这里插入图片描述

1、最大最小归一化

最大最小归一化。这种方法是最简单的一种方法，它主要需要分别针对每一个特征变量，遍历这一个特征变量的所有值，然后保存其中的最大值与最小值，通过计算此

最低0.47元/天解锁文章

七层楼的疯子

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

七层楼的疯子 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。