MinMaxScaler

最新推荐文章于 2024-03-11 09:59:39 发布

汪汪狗狗

最新推荐文章于 2024-03-11 09:59:39 发布

阅读量5.2k

点赞数 2

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51402817/article/details/111633724

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

该博文介绍了如何使用sklearn库中的MinMaxScaler进行数据归一化，将其转换到指定区间[0,1]。归一化过程包括计算数据范围，然后通过公式将数据标准化。步骤包括引入库、实例化Scaler、使用fit_transform或transform方法对数据进行处理，以及使用inverse_transform进行反归一化。此外，还提到了partial_fit方法用于处理大规模数据流。

摘要由CSDN通过智能技术生成

前言

这篇博文记录了sklearn.preporcessing.MinMaxScaler的用法

一、MinMaxScaler能做什么？

将数据归一化至某一区间的归一方法

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

其中 min和max是数据范围

二、使用步骤

1.引入库

from sklearn.preprocessing import MinMaxScaler

2.参数

2.1 feature_range：tuple (min, max), default=(0, 1)

归一化后的数据范围，默认将数据转化至[0,1]区间

2.2 copy：bool, default=True

如果输入数据是numpy array格式，设置false，可不复制数据。

ascaler = MinMaxScaler(feature_range=(0, 1),copy=False)  # copy=默认为True

3.方法

3.1 fit(x): 计算x的数据范围，返回一个MinMaxScaler

3.2 fit_transform(x): 计算x的数据范围，并将数据归一化

3.3 transform(x): 根据数据范围将数据归一化

3.4 inverse_transform(X): 根据min和max，返回归一化之前的值

a=numpy.asarray([1,2,3,4,5])
a=numpy.reshape(a,(-1,1))
#生成一个二维的array

ScalerA = MinMaxScaler(feature_range=(0, 1)).fit(a)
#计算a中数据的范围，返回一个可调用的MinMaxScaler

c = ScalerA.transform(numpy.asarray([2.4,3]).reshape((-1,1)))
#根据ScalerA中的参数（也就是a的范围），对array[2.4,3]进行归一化，结果为[[0.35],[0.5]]

d = ScalerA.inverse_transform(c)
#根据ScalerA中的参数，将c中的数字进行反归一化，结果为[[2.4],[3]]

3.5 get_params([deep])

3.6 partial_fit(x): 所有的X都作为单个批处理处理。当fit()由于n_samples的数量非常大或者X是从一个连续的流中读取而不可行时，可以使用此方法。

3.7 set_params(***params): 为当前的estimator设置参数

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
MinMaxScaler

前言这篇博文记录了sklearn.preporcessing.MinMaxScaler的用法一、MinMaxScaler能做什么？将数据归一化至[0,1]区间归一方法X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))X_scaled = X_std * (max - min) + min其中 min和max是数据范围二、使用步骤1.引入库from sklearn.preproce...
复制链接

扫一扫

专栏目录

汪汪狗狗 CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

106万+: 周排名

173万+: 总排名

1万+: 访问

: 等级

108: 积分

9: 粉丝

31: 获赞

19: 评论

57: 收藏

私信

关注

热门文章

分类专栏

python 2篇
Windows 1篇
CSDN

最新评论

如何在指定文件夹下打开Jupyter Notebook
2301_82031834: 大佬，膜拜膜拜膜拜您
【原创】Spyder project gbk编码闪退问题解决
m0_69969188: 修改需要申请权限怎么回事
【原创】使OneDrive同步时排除某个类型的文件
jaliey: 这个注册表实际与本地组策略有关。 1. 安装适用于 Windows 的 OneDrive 同步应用。（若要查看正在发行的版本并下载这些版本，请转至发行说明。）安装同步应用将会下载 .adml 和 .admx 文件。 2. 浏览到 %localappdata%\Microsoft\OneDrive\BuildNumber\adm\ (个人电脑浏览C:\Program Files (x86) \Microsoft OneDrive\BuildNumber\adm\ 或 C:\Program Files\Microsoft OneDrive\BuildNumber\adm\ ) (其中 BuildNumber 是 “关于 ”选项卡上的同步应用设置中显示的数字) 。 3. 将根目录中的.admx 文件复制粘贴到域的中央存储、\\domain\sysvol\domain\Policies\PolicyDefinitions (其中 domain是域名（如 corp.contoso.com) ），并将相应语言子文件夹中的 .adml 粘贴到PolicyDefinitions相应的语言子文件夹中，例如 en-us。如果 PolicyDefinitions 文件夹不存在，请参阅如何在 Windows 中创建和管理组策略管理模板的中央存储，或在 %windir%\policydefinitions 下使用本地策略存储。运行远程服务器管理工具，在域控制器上配置设置。或在计算机gpedit.msc进入本地组策略编辑器维护。另外，如果想要屏蔽的文件有多个.，最好使用*.filetype。具体输入规则可以从本地策略进去看到。
如何在指定文件夹下打开Jupyter Notebook
醉竺: 6666确实有用感谢，对新手很有帮助
【原创】使OneDrive同步时排除某个类型的文件
CNDS_199: 我也是教育邮箱，重启onedrive和电脑都不行

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。