特征预处理(归一化,标准化)基础

笑_发财了

已于 2024-05-13 21:18:19 修改

阅读量1.6k

点赞数 45

分类专栏：机器学习文章标签：机器学习人工智能

于 2024-05-13 21:05:21 首次发布

本文链接：https://blog.csdn.net/lx2929266892/article/details/138818284

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

特征预处理:归一化/标准化目的

特征的的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些模型(算法)无法学习到其他的特征.

归一化

归一化内容

通过对原始数据进行变换把数据映射到【mi,mx】(默认为[0,1])之间

举个例子

归一化的API

sklearn.preprocessing.MinMaxScaler (feature_range=(0,1)… )

feature_range 缩放区间

fit_transform(X) 将特征进行归一化缩放

# 特征预处理(归一化)
# 1导入工具包

from sklearn.preprocessing import MinMaxScaler

# 准备数据
data = [[90, 2, 10, 40],
        [60, 4, 15, 45],
        [75, 3, 13, 46]]
# 3实例化特征工程方法
transform = MinMaxScaler()
# 4处理
data = transform.fit_transform(data)
# 5输出
print(data)
#结果
[[1.         0.         0.         0.        ]
 [0.         1.         1.         0.83333333]
 [0.5        0.5        0.6        1.        ]]

标准化

数据标准化内容

通过对原始数据进行标准化，转换为均值为0标准差为1的标准正态分布的数据

数据标准化API

sklearn.preprocessing. StandardScaler()
fit_transform(X) 将特征进行归一化缩放

#标准化预处理
#导包
from sklearn.preprocessing import StandardScaler
#准备数据
data = [[90, 2, 10, 40],
        [60, 4, 15, 45],
        [75, 3, 13, 46]]
#实例化特征工程方法
transform = StandardScaler()
#4处理
data = transform.fit_transform(data)
#输出
print(data)#标准化后的数据
print('-'*30)
print(transform.mean_)#平均值
print('-'*30)
print(transform.var_)#方差
#结果
[[ 1.22474487 -1.22474487 -1.29777137 -1.3970014 ]
 [-1.22474487  1.22474487  1.13554995  0.50800051]
 [ 0.          0.          0.16222142  0.88900089]]
------------------------------
[75.          3.         12.66666667 43.66666667]
------------------------------
[150.           0.66666667   4.22222222   6.88888889]