数据归一化 - MinMaxScaler()/MaxAbsScaler() - Python代码

最新推荐文章于 2024-05-28 09:02:39 发布

黄饱饱_bao

最新推荐文章于 2024-05-28 09:02:39 发布

阅读量10w+

点赞数 57

分类专栏：数据变换与计算文章标签： Python 数据预处理归一化标准化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40683253/article/details/81508321

版权

目录

数据归一化的背景介绍

MinMaxScaler：归一到 [ 0，1 ]

MaxAbsScaler：归一到 [ -1，1 ]

去均值，方差规模化

归一化

数据归一化的背景介绍

在之前做聚类分析的时候我们发现，聚类的效果往往特别受其中一列数据的影响，使得原本应该散布在二维平面图上的点，变成聚集在一条线上的点，可想而知，其聚类效果肯定不理想。

左图：为所有数据都归一化之后的聚类分析散点图；

右图：为其中一列是合同金额，并且没有归一化数据的散点图；

归一化方法有两种形式，一种是把数变为（0，1）之间的小数，一种是把有量纲表达式变为无量纲表达式，成为纯量。后者常见于微波之中，也就是电路分析、信号系统、电磁波传输等，研究物理的人会比较熟悉。而像我们这些普通的数据分析师的日常工作中，不太会遇见需要归一化为无量纲表达式的情况，因此只讨论归一化到 [0，1] 的情况。

归一化一般是把数据映射到 [ 0，1 ] ，但也有归一到 [ -1，1 ] 的情况，两种情况在Python中分别可以通过MinMaxScaler 或者 MaxAbsScaler方法来实现。

MinMaxScaler：归一到 [ 0，1 ]

原理

最低0.47元/天解锁文章

关注

57
点赞
踩
287

收藏

觉得还不错? 一键收藏
20
评论
数据归一化 - MinMaxScaler()/MaxAbsScaler() - Python代码

目录归一化数据归一化的背景介绍MinMaxScaler：归一到 [ 0，1 ] MaxAbsScaler：归一到 [ -1，1 ] 标准化去均值，方差规模化归一化数据归一化的背景介绍在之前做聚类分析的时候我们发现，聚类的效果往往特别受其中一列数据的影响，使得原本应该散布在二维平面图上的点，变成聚集在一条线上的点，可想而知，其聚类效果肯定不理想。左图：为所有数...
复制链接

扫一扫

专栏目录

评论 20

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。