归一化数值
在处理这种不同取值范围的特征值时,我们通常采用的方法是将数值归一化,如将取值范围处理为0到1或者-1到1之间。下面的公式可以将任意取值范围的特征值转化为0到1区间内的值:
newValue=(oldValue-min)/(max-min)
其中min和max分别是数据集中的最小特征值和最大特征值。
一般的三种归一化方法:
1、线性函数转换,表达式如下:
y=(x-MinValue)/(MaxValue-MinValue) 归一化至[0 1]
y=2*(x-MinValue)/(MaxValue-MinValue)-1 归一化至[-1 1]
2、对数函数转换,表达式如下:
y=log10 (x)
3、反余切函数转换 ,表达式如下:
y=arctan(x)*2/PI
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理
归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1–+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;SVM是以降维后线性划分距离来分类和仿真的,因此时空降维归一化是统一在-1–+1之间的统计坐标分布。
当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小ÿ