数据预处理

from sklearn import preprocessing #预处理模块
import numpy as np
均值移除
将数据跨度大(比如:[-1000,10,1000])的数据均值处理,处理到0和1左右,

mean 平均值
Std 标准差

data = np.array([[-1000,10,40],[10,300,10],[20,1,30]])
print(data)
[[-1000    10    40] 
[   10   300    10] 
[   20     1    30]]

result = preprocessing.scale(data)  #0均值处理  中心化处理
print(result)
[[-1.41416209 -0.67445655  1.06904497] 
[ 0.69663157  1.41371853 -1.33630621] 
[ 0.71753052 -0.73926198  0.26726124]]

print(np.mean(result,axis=0))   #  列   约等于0   均值  ,axis=0是列 ,,axis=1是行
[-1.11022302e-16 -1.11022302e-16 -7.40148683e-17]

print(np.std(result,axis=0))   #列上约等于1   标准差
[1. 1. 1.]
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值