Python scikit-learn,数据的预处理,标准化,StandardScaler

 

标准化的目的与归一化一样,都是为了避免某个特征的重要程度过大或过小。

标准化的优点:受异常点的影响较小。 适用于繁杂大数据。

demo.py(scikit-learn,数据的预处理,标准化,StandardScaler):

from sklearn.preprocessing import StandardScaler


# 标准化处理
std = StandardScaler()
# (fit_transform()等同于fit()填充数据 + tansform()转换数据)(tansform转换器转换数据时所依赖的均值、标准差等取决于fit()填充的数据)
data = std.fit_transform([[ 1., -1., 3.],[ 2., 4., 2.],[ 4., 6., -1.]])
print(std.mean_)  # [2.33333333 3. 1.33333333]  每列的平均值

print(data)
'''
[[-1.06904497 -1.35873244  0.98058068]
 [-0.26726124  0.33968311  0.39223227]
 [ 1.33630621  1.01904933 -1.37281295]]

'''

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值