紧接上文
1.离差标准化:对原始数据的一种线性变换,将原始数据的数值映射到【0,1】区间,公式如下:
用x到最小值的距离除以最大值到最小值的距离,也可理解为最小值为起点,最大值为终点,各点到起点的距离占总路程的比率。
2.标准差标准化:相信大家在概率论与数理统计已经学过,这里我简单的说下
这种方法用的十分广泛,x杠(我不知道上划线咋搞,先这么叫吧)为原始数据均值,分母为原始数据的标准差。这种方法与上面不同,他的取值范围不仅限于[0,1]并且可能会出现负值。(在MATLAB中一般是按照列对矩阵进行处理)
调用格式:
Z = zscore(X)
[Z,mu,sigma] = zscore(X)
[…] = zscore(X,1)
[…] = zscore(X,flag,dim)
举例:
% 调用rand函数产生一个10行,4列的随机矩阵,每列是不同的分布
x = [rand(10,1), 5*rand