先说一下总体的想法吧:
(1)将信号进行输入
(2)对信号进行小波分解,然后得到每一层的小波分解系数
(3)对每一条子带进行提取特征
(4)选择其中能够代表的特征矢量
(5)对特征矢量进行添加标签,然后作为输入参数输入到神经网络中(BP神经网络居多)
(6)不断地调整,优化参数
(7)输出诊断信息
现在通过前边几步的操作,能够证明现在小波分解之后提取的每一层系数的能量值可以表征正常样本和故障样本的差别,那么就可以用每一层的系数能量作为该样本的特征进行提取,但是在这个上边你会发现,在进行小波分解的时候,不管你分解出几层,分解出来的系数总是分解层数的两倍,这样一来的话就会导致提取的特征过于多,数据运算量过大,使得学习效率降低。所以在选择特征矢量的过程中,我们就要有选择的进行挑选有效的特征矢量。
举例来说,在一个信号中,我们进行了四层的小波分解,那么我们会得到八种的小波系数,然后我们对每一层的小波分解进行求值,我们将会得到以下八个数值。
% 设定信号四层分解的特征值
E = 7.01E+07;
Ea1 = 3.72E+07;
Ea2 = 2.12E+07;
Ea3 = 1.34E+07;
Ea4 = 9.50E+06;
Ed1 = 1.42E+02;
Ed2 = 49.1677;
Ed3 = 784.6419;
Ed4 = 1.47E+05;
从这个上边我们看出来信号总的能量值为7.01E+07,而分解之后的A和D所占的能量值是不同的,那么我们怎么选择才能更好的表达原来信号的特征呢。虽然我们很容易看出来分解之后的逼近信号的能量值都很接近原始信号的能量值,但是我们要进行提出相对应的办法来说明,不能是说“显然”啥的。
其实这是属于数据降维的范围,在数据降维的方法上其实很常见的就是PCA(主成分分析)了,所谓PCA就是通过计算,将最有效的信息保留或者设定一种权重,将用处不大的信息进行删除或者设定很小的权重来达到降维的效果,比如说一起租房子,三个人都是出租金的三分之一,另外一个人没有出钱,这样的话,在整个房子的有效信息里就只会包含三个人,因为最后那个人没有有效的信息,这就叫主成分分析。
然后特征提取的时候提出了一种I-PCA的方法,具体的实现过程等会出一个番外篇单独介绍。