数据归一化处理方法_数据预处理：标准化和归一化

最新推荐文章于 2024-08-23 10:00:00 发布

weixin_39991531

最新推荐文章于 2024-08-23 10:00:00 发布

阅读量3.5k

点赞数 1

文章标签：数据归一化处理方法数据标准化处理方法

本文详细解析了数据预处理中的标准化（standardization）和归一化（scale），介绍了两种方法的公式、实际意义及在Python中使用sklearn库的应用。标准化将数据转化为均值为0，方差为1；归一化则将数据缩放到0-1之间。虽然并非所有模型都需要这两种预处理，但对于某些模型如决策树和随机森林，它们并不重要。

摘要由CSDN通过智能技术生成

网上很多关于标准化和归一化的文章，不少是误人子弟的存在。这篇文字希望给大家讲清讲透这两个概念。

一、标准化（standardization）

公式一般为：(X-mean)/std，其中mean是平均值，std是方差。

从公式我们可以看出，标准化操作（standardization）是将数据按其属性（按列）减去平均值，然后再除以方差。这个过程从几何上理解就是，先将坐标轴零轴平移到均值这条线上，然后再进行一个缩放，涉及到的就是平移和缩放两个动作。这样处理以后的结果就是，对于每个属性（每列）来说，所有数据都聚集在0附近，方差为1。计算时对每个属性/每列分别进行。

下面我们通过实操加深印象，并真正理解标准化的实际意义。使用sklearn中的preprocessing中的scale()函数，可以直接将给定数据进行标准化。

首先我们导入需要的库，和需要处理的数据。我们随便导入一支股票，000002万科a。（数据源来自tushare pro版，感谢挖地兔）。

接着，我们选取该股票最后的100个交易日的数据，选取价格和成交量两个特征作为演示。很显然，这两个特征量纲不一样，数值相差很大，需要对他们进行一个数据预处理。先看一下原始数据&#

最低0.47元/天解锁文章

weixin_39991531

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。