统计数据归一化与标准化

转载自:http://blog.csdn.net/ding89629/article/details/7410191 ,谢谢。

归一化:

1)把数据变成(0,1)之间的小数

2)把有量纲表达式变成无量纲表达式

 

归一化算法有:

1.线性转换

       y=(x-MinValue)/(MaxValue-MinValue

2.对数函数转换:

      y=log10(x)

3.反余切函数转换

      y=atan(x)*2/PI

4.线性也与对数函数结合

      式(1)将输入值换算为[-1,1]区间的值,

      在输出层用式(2)换算回初始值,其中 和分别表示训练样本集中负荷的最大值和最小值。

 

数据规范化:

1)把数据按比例缩放,使之落入一个小的空间里

 

1.最小-最大规范化(线性变换)

      y=( (x-MinValue) / (MaxValue-MinValue) )(new_MaxValue-new_MinValue)+new_minValue

 

2.z-score规范化(或零-均值规范化)

 y=(x-X的平均值)/X的标准差

 优点:当X的最大值和最小值未知,或孤立点左右了最大-最小规范化时, 该方法有用

3.小数定标规范化:通过移动X的小数位置来进行规范化

 y= x/10的j次方  (其中,j使得Max(|y|) <1的最小整数

4.对数Logistic模式:

      新数据=1/(1+e^(-原数据))

5.模糊量化模式:

新数据=1/2+1/2sin[派3.1415/(极大值-极小值)*

      (X-(极大值-极小值)/2) ]       X为原数据

阅读更多
个人分类: math
上一篇C++静态成员函数小结
下一篇数学家的争吵
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭