Pyhton 中的Scale 和Normalization(正则化)

最新推荐文章于 2021-03-25 11:09:07 发布

liluo9527

最新推荐文章于 2021-03-25 11:09:07 发布

阅读量1.3w

点赞数 5

分类专栏： Python 函数

本文链接：https://blog.csdn.net/liluo9527/article/details/51028617

版权

本文探讨了Python中sklearn.preprocessing库在数据预处理中的应用，重点关注Standardization（标准化）和Centering（归一化）。标准化通过减去均值并除以标准差使数据具有0均值和1方差，适用于发现离群点。归一化方法包括min-max缩放和最大绝对缩放，确保数据范围在特定区间内。正则化则是将样本缩放到单位范数，常用范式有l1、l2和max。在不同场景下，标准化、归一化和正则化各有优势，选择应根据具体任务需求。

摘要由CSDN通过智能技术生成

谈一下Python中sklearn.preprocessing与数据预处理相关的函数

一、Scale包括两部分：Standardization(标准化)和Centering(归一化)

1、Standardization：

newX = (X- 均值) / 标准差(standard deviation)， newX 的均值=0，方差= 1,可用于发现离群点，Python中计算函数为preprocessing.scale和preprocessing.StandardScale，区别在于preprocessing.StandardScale可以保存测试集上的均值、标准差,从而在训练集做一样的处理，

2、Centering：