一、数学公式:
1.均值、去均值:
(1) 均值:
对每个特征求均值,即对每列求均值。
import numpy as np
data = np.array([[1, 2], [4, 3]])
print('数组为:\n', data)
mean = data.mean(axis=0)
print('均值为:\n', mean)
# 结果为
数组为:
[[1 2]
[4 3]]
均值为:
[2.5 2.5]
(2) 去均值:
每个特征的值减去对应特征的均值。
move_mean = data-mean
print('去均值:\n', move_mean)
# 结果为
去均值:
[[-1.5 -0.5]
[ 1.5 0.5]]
2.标准差(标准偏差):
(1) 标准差:
每个特征的值减去对应特征均值的平方和, 然后除以总值的数量,最后开根号。