StandarScaler

最新推荐文章于 2022-12-06 11:13:30 发布

小小笛

最新推荐文章于 2022-12-06 11:13:30 发布

阅读量1.9k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42019250/article/details/82763702

版权

数据在前处理的时候，经常会涉及到数据标准化。将现有的数据通过某种关系，映射到某一空间内。常用的标准化方式是,减去平均值，然后通过标准差映射到均至为0的空间内。系统会记录每个输入参数的平均数和标准差，以便数据可以还原。

很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数的方差。

StandardScaler能够轻松的实现上述功能。

定义：

sc = StandarScaler(copy=True, with_mean=True, with_std=True)

三个默认值为True。

copy 如果为False，就会用归一化的值替代原来的值。如果被标准化的数据不是np.array或scipy.sparse CSR matrix, 原来的数据还是被copy而不是被替代。

归一化的值：表示一个事物有不同的维度｛即：属性｝，每个属性的取值范围不同，导致计算时此属性占用的权重不同。

with_mean 在处理sparse CSR或者 CSC matrices 一定要设置False不然会超内存。

可查询属性：

scale_：缩放比例或标准差。

mean_：特征平均值

var_：特征方差

n_sample_seen_：样本数量（可增加）

可被调用的方法：

fit：计算输入数据各特征的平均值

fit_transform：通过fit_params调整数据X,y得到一个调整后的X

get_params：返回StandardScaler对象的设置参数

inverse_transform：按照缩放规律反向还原当前数据

partial_fit：计算平均值和标准差

transform：基于现有的对象规则，标准化新的参数

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
StandarScaler

数据在前处理的时候，经常会涉及到数据标准化。将现有的数据通过某种关系，映射到某一空间内。常用的标准化方式是,减去平均值，然后通过标准差映射到均至为0的空间内。系统会记录每个输入参数的平均数和标准差，以便数据可以还原。很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数的方差。StandardScaler能够轻松的实现上述功能。定义：sc = StandarScaler(cop...
复制链接

扫一扫

小小笛 CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

171万+: 周排名

56万+: 总排名

2066: 访问

: 等级

34: 积分

1: 粉丝

2: 获赞

1: 评论

9: 收藏

私信

关注

热门文章

最新评论

StandarScaler
NH33: n_samples_seen_ 少了个s

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

centos云服务器Django创建app时出现No module named ‘_sqlite3′

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。