学习目标:
机器学习----数据预处理学习内容:
1、 均值移除、范围缩放 2、归一化 3、二值化 4、 独热编码、标签编码学习记录:
# 均值移除(标准化)
# 均值0标准差1
import numpy as np
import sklearn.preprocessing as sp
raw_samples = np.array([
[17, 90, 4000],
[20, 80, 5000],
[23, 75, 5500]
])
result = sp.scale(raw_samples) # 每一列均值为0标准差为1
print(result)
import numpy as np
import sklearn.preprocessing as sp
# 范围缩放(特征值缩放)
raw_samples = np.array(