sklearn 中的数据预处理函数，标准化

最新推荐文章于 2023-04-11 19:34:00 发布

心态与习惯

最新推荐文章于 2023-04-11 19:34:00 发布

阅读量1k

点赞数

分类专栏： Python 统计学/机器学习文章标签： sklearn 数据预处理标准化

本文链接：https://blog.csdn.net/robert_chen1988/article/details/107702639

版权

58 篇文章 30 订阅

订阅专栏

54 篇文章 33 订阅

订阅专栏

sklearn 是 python 中一个常用的机器学习与统计分析包，功能十分强大，既能做普通的统计分析，也可以做一些常用的机器学习算法。

在分析数据前，一般要对数据进行预处理，常用的数据预处理函数有：

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

StandardScaler: 类似于 Scale，只不过可保存训练集中的均值、方差参数
例如：可以对测试集生成一个 StandardScaler，就有了一个包含均值与方差的标准化的类。这个类可以通过 transform 函数同时标准化训练集与测试集
Normalize: 对每一行按p-范数标准化，又称正则化：主要思想是对每个样本计算其 p-范数，然后对该样本中每个元素除以该范数，这样处理的结果是使得每个处理后样本的 p-范数（一般为 l1-norm 或 l2-norm）等于1。

关注