[译]sklearn.preprocessing.StandardScaler

class sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True)

通过去除均值和缩放为单位变量实现特征标准化。

计算方式为
z = x − μ s z=\frac{x-\mu}{s} z=sxμ
μ \mu μ是训练样本的均值或者为0(当with_mean=False), s s s是标准差或者1(如果with_std=False

针对么个特征通过计算训练样本的相关统计量实现中心化和缩放独立进行,均值和标准差会被存储一遍后续transform方法使用。

数据集的标准化是很多机器学习算法常见的要求:这些算法可能会表现低劣如果独立特征不是或多或少呈现标准正态分布。

例如,一个学习算法(如SVM算法的RBF核,线性模型的L1、L2正则因子)目标函数中常用的元素假定所有特征均值为0,且同方差。

如果一个特征的方差比其他的量级要大,它可能会主宰目标函数,导致模型不能正确的从其它特征处学到本质的规律。

这个定标器也可用于sparse CSR or CSC 矩阵通过with_mean=False避免破坏数据的稀疏结构

  • Parameters

Parameters数据结构意义
copyboolean, optional, default TrueFalse:不保存副本,立即缩放
with_meanboolean, True by defaultTrue:指定数据中心。
with_stdboolean, True by defaultTrue:以单位标准差缩放
  • Attributes

Attributes数据结构意义
scale_ndarray or None, shape (n_features,)
mean_ndarray or None, shape (n_features,)
var_ndarray or None, shape (n_features,)
n_samples_seen_int or array, shape (n_features,)
  • Methods

Methods意义
fit(self, X[, y])计算缩放用的均值和方差
fit_transform(self, X[, y])拟合,然后转换
get_params(self[, deep])获取参数
inverse_transform(self, X[, copy])将数据返回原始形式
partial_fit(self, X[, y])Online computation of mean and std on X for later scaling.
set_params(self, **params)设置参数
transform(self, X[, copy])执行标准化
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值