【机器学习】数据预处理 - 归一化和标准化_归一化处理(1)

2401_84160361

于 2024-04-28 11:31:09 发布

阅读量824

点赞数 20

分类专栏：程序员文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/2401_84160361/article/details/138272640

版权

本文介绍了如何使用sklearn库中的MinMaxScaler和StandardScaler进行数据归一化，展示了如何设置归一化范围，以及它们背后的原理。特别提到了MinMaxScaler的局限性和标准化的适用场景。

摘要由CSDN通过智能技术生成

from sklearn import preprocessing
from sklearn import datasets


# 初始化
mm = preprocessing.MinMaxScaler()

# 获取数据源
iris = datasets.load_iris()

# 归一化处理
new_data = mm.fit_transform(iris.data)
print(new_data)

输出：

[[0.22222222 0.625      0.06779661 0.04166667]
 [0.16666667 0.41666667 0.06779661 0.04166667]
 ......
 [0.44444444 0.41666667 0.69491525 0.70833333]]

从结果可以看到，归一后的结果，数据规格都在 0~1 之间。

实际上，fit_transform() 不只可以 “归1” ，我们自己设置归一的范围。

四、设置归一化范围

实例化 MinMaxScaler 时，指定 feature_range 参数的值，可以设置归一的「范围」。

from sklearn import preprocessing
from sklearn import datasets


# 初始化
mm = preprocessing.MinMaxScaler(feature_range=(2,3))

# 获取数据源
iris = datasets.load_iris()

# 归一化处理
new_data = mm.fit_transform(iris.data)
print(new_data)

输出：