归一化(标准化):Z-score标准化方法;min-max标准化
更为复杂的方法为【重新缩放法】,出自:http://www.nohup.cc/article/166/#menu_index_2
【Z-score标准化方法】
标准化方法有一个好处:python里面的numpy包中有求矩阵均值,标准差等统计参数的函数,很方便。
其中,,,, 分别表示原矩阵中需要归一化的输入数据,原矩阵数据的均值,原矩阵数据的标准差,归一化后的输出数据。
在python中利用 numpy,实现。
假设,样本含有n个因素,共有m个样本,即可以组成 m*n,矩阵。
归一化如下:
def Normalization(self):
self.martix = open_the_file() #打开数据文件函数
u = np.mean(self.martix, axis=0) # axis=0,计算每一列的均值
v = np.std(self.martix, axis=0) # axis=0计算每一列的标准差
for j in range(self.M):
for i in range(self.N):
self.martix[j][i] = (self.martix[j][i] - u[i]) / v[i]
【min-max标准化】
mix(x)为此列的最小值,max(x)为此列的最大值,归一化后的值。
import numpy as np
a = np.loadtxt(r'C:\Users\happy\test1.txt') #3*7的数组
max_martix = a.max(0) #0代表按照列比较;1代表按行比较
min_martix = a.min(0)
deff_value = max_martix - min_martix
for i in range(0,2):
for j in range(0,7):
a[i][j] = (a[i][j] - min_martix[j]) / deff_value[j]