数据无量纲化基于数据中心化,数据缩放,可以分为数据标准化与数据归一化两类无量纲化方法。
数据中心化:原始数据减去某值
数据缩放:原始数据除以某值
数据标准化:x - 均值 / 标准差,数据变为正态分布
使用sklearn实现如下
from sklearn.preprocessing import StandardScaler #导入标准化库
data = [[-1,2],[-0.5,6],[0,10],[1,18]]
s = StandardScaler() #实列化
re = s.fit_transform(data) #输出标准化结果
re
逆转:将标准化后的数据恢复成原始数据
s.inverse_transform(re) #将标准化进行逆转
查看数据标准化后的均值
s.mean_ #查看均值
查看数据标准化后的方差
s.var