数据处理：数据归一化/标准化常用的算法包括极差法和z-score法

最新推荐文章于 2025-03-13 07:13:30 发布

rubyw

最新推荐文章于 2025-03-13 07:13:30 发布

阅读量1.2k

点赞数

分类专栏：数据运营文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rubyw/article/details/134362641

版权

数据运营专栏收录该内容

27 篇文章

订阅专栏

数据归一化和数据标准化都是数据预处理方法，用于使数据在不同尺度下具有可比性和可解释性。两者的主要区别在于归一化将数据缩放到0和1之间，而标准化则将数据缩放到均值为0，标准差为1的范围内。

具体来说，数据归一化是将原始数据缩放到0和1之间的过程，通过以下公式进行计算：

$\frac{x - \min(x)}{\max(x) - \min(x)}$

其中， $x$ 是原始数据， $\min(x)$ 和 $\max(x)$ 分别是数据的最小值和最大值。归一化后的数据范围在0到1之间。

数据标准化则是将原始数据缩放到均值为0，标准差为1的范围内，通过以下公式进行计算：

$\frac{x - \mu}{\sigma}$

其中， $x$ 是原始数据， $\mu$ 是数据的均值， $\sigma$ 是数据的标准差。标准化后的数据呈现标准正态分布，均值为0，标准差为1。

归一化和标准化的选择取决于问题的具体情况，但是这两种方法都有助于提高机器学习模型的性能和准确性。

标准差是用于衡量一组数据分散程度的统计量。计算公式如下：

标准差 =√[Σ(xi-平均数)²/n]

其中，xi表示数据集中的每个数据，平均数表示所有数据的平均值，n表示数据集中的数据个数。

下面是标准差计算的详细步骤：

计算所有数据的平均值。

分别计算每个数据与平均值之差的平方。

对所有差的平方求和。

将差的平方和除以数据个数n。

然后对上述结果取平方根即为标准差。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

rubyw 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。