python数据预处理---标准化归一化方法介绍与比较

最新推荐文章于 2022-09-25 20:58:36 发布

算法cook

最新推荐文章于 2022-09-25 20:58:36 发布

阅读量1.2k

点赞数 2

文章标签： python 机器学习大数据人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40937913/article/details/108942439

版权

文章目录

前言
一、什么是 and 为什么要标准化
二、方法介绍与实操
总结与方法选择

前言

数据预处理是数据化运营过程中的重要环节，他直接决定了后期所有的数据工作的质量和价值输出。包括数据清洗、转换、规约、聚合、抽样等。本文主要介绍标准化的主要方法，并给出代码实操。

一、什么是 and 为什么要标准化

数据标准化是一个常用的数据预处理操作，目的是处理不同规模和量纲的数据，使其缩放到相同的数据区间和范围，以减少规模、特征、分布差异等对模型的影响。
在项目实例中，一个目标变量Y，是由若干个特征变量X共同影响控制的，如果特征变量X中某些变量X1的量纲和数值的量级远远大于其他变量，那么X1对目标变量Y的影响程度也会远远大于其他变量。

优点：标准化后的数据不仅可以用作模型计算，还具有直接计算并生成复合指标的意义，是加权指标的必要步骤，同时在神经网络的权重参数的收敛也有加速作用。

二、方法介绍与实操

1.实现中心化和正态分布的Z-Score

Z-Score标准化是基于原始数据的均值和标准差进行的标准化，假设原转化的数据为x，新数据为x`，那么计算公式为：

x`=(x-mean) / std
mean和std分别为x所在列的均值和标准差

最低0.47元/天解锁文章

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
python数据预处理---标准化归一化方法介绍与比较

文章目录前言一、什么是 and 为什么要标准化二、方法介绍与实操1.实现中心化和正态分布的Z-Score2.实现归一化的Max-Min3.用于稀疏矩阵的MaxAbs4.针对离群点RobustScaler方法总结与方法选择前言数据预处理是数据化运营过程中的重要环节，他直接决定了后期所有的数据工作的质量和价值输出。包括数据清洗、转换、规约、聚合、抽样等。本文主要介绍标准化的主要方法，并给出代码实操。一、什么是 and 为什么要标准化数据标准化是一个常用的数据预处理操作，目的是处理不同.
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。