A.归一化 vs. 标准化
归一化:要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。一般指将数据限制在[0 1]之间。
(1)把数变为(0,1)之间的数,主要是为了数据处理方便提出来的,把数据映射到0-1之间处理,更便携快速;
(2)把有量纲表达式变为无量纲表达式,成为纯量;
(3) 一般采用最大-最小规范化对原始数据进行线性变换:X*=(X-Xmin)/(Xmax-Xmin)
标准化:对原始数据进行缩放处理,限制在一定的范围内。一般指正态化,即均值为0,方差为1。即使数据不符合正态分布,也可以采用这种方式方法,标准化后的数据有正有负。
由于信用指标体系的各个指标度量单位是不同的,为了能够将指标参与评价计算,需要对指标进行规范化处理,通过函数变换将其数值映射到某个数值区间。
(1)数据同趋化处理:解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果;
(2)无量纲化处理:要解决数据的可比性;
(3)一般采用Z-score规范化:即均值为0,方差为1的正态分布;
在matlab里面ÿ