一、一种基于改进胶囊网络的轴承故障诊断方法
1.具体步骤如下:
![](https://img-blog.csdnimg.cn/ab8f2a3996504479aa76da6705649fac.png)
1)获取轴承的训练集,所述训练集包含多个带有故障标签的轴承二维时频数据,
所述轴承二维时频数据通过小波变换轴承的一维振动信号获得;
2)构建改进卷积胶囊网络,利用训练集训练改进卷积胶囊网络得到训练好的轴
承故障诊断模型。
将训练集输入至Inception7层的输入层,利用Inception7层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过Inception7层的concat连接层
进行特征汇总得到第一特征图;将第一特征图输入至Ince ption5层的输入层,利用
Inception5层的第一尺度层、第二尺度层、第三尺度层、第四尺度层并行特征提取并通过
Inception5层的c0oncat连接层进行特征汇总得到第二特征图;将第二特征图输入至
Attention层,利用通道注意力模块对第二特征图进行通道特征提取并结合第二特征图获
得通道特征图,接着利用空间注意力模块对通道特征图进行空间特征提取并结合通道特征图得到空间特征图;将空间特征图输入至胶囊网络的主要帽层形成低层胶囊网络多个神元,利用动态路由算法更新低层胶囊网络多个神经元的耦合系数实现高层胶囊网络多个神经元的更新,将高层胶囊网络多个神经元的输出向量输入至分类层得到预测故障类型;
分别计算高层胶囊网络多个神经元的输出向量对应的二范数得到各类故障
类型的概率,将各类故障类型的概率输入至分类层得到预测故障类型,利用预测故障类型
结合故障标签及各类故障类型的概率计算Margin Loss损失函数,利用Margin Loss损失函数反向更新特征提取网络及胶囊网络中的权重系数;
重复以上步骤,直至达到预设的权重迭代次数,从而形成训练好的轴承故障
诊断模型。
3)将测试集输入训练好的轴承故障诊断模型得到轴承故障诊断结果。
2.Inception结构
1)Inception7层。包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和concat连接层,
第一尺度通道数为32,卷积核为1
×
1;第二尺度第一层通道数为32,卷积核
为1
×
1,第二层通道数为32,卷积核为5
×
5;第三尺度第一层通道数为32,卷积核为1
×
1,第
二层通道数为32,卷积核为7
×
7;第四尺度第一层为尺寸为5
×
5的最大值池化层,第二层通
道数为32,卷积核为1
×
1整个层激活函数均为relu函数。
如下图所示:
2)Inception5层。
包括输入层、第一尺度层、第二尺度层、第三尺度层、第四尺度层和
concat连接层;第一尺度通道数为32,卷积核为1
×
1;第二尺度第一层通道数为32,卷积核
为1
×
1,第二层通道数为32,卷积核为3
×
3;第三尺度第一层通道数为32,卷积核为1
×
1,第
二层通道数为32,卷积核为5
×
5;第四尺度第一层为尺寸为3
×
3的最大值池化层,第二层通
道数为32,卷积核为1
×
1;整个层激活函数均为relu函数。
3.注意力模块(Attention层)
Attention层包含通道注意力模块和空间注意力模块,所述通道注意力模块的
激活函数为relu和sigmoid函数,所述空间注意力模块的激活函数为sigmoid函数。利用通道注意力模块对第二特征图提取并结合第二特征图获得通道特征值,具体步骤为:
二、基于残差-胶囊网络的行星齿轮箱故障诊断方法
1.具体步骤如下:
![](https://img-blog.csdnimg.cn/38b3fd9d07a54f3e9fb5b4901ac9b3cf.png)
1)根据需要设置行星齿轮箱的K种不同故障状态,分别在正常状态和每种故障状态下获取若干预设时长为T的时域振动信号,然后对各个时域振动信号通过短时傅里叶变换获得二维时频数据,生成原始时频图像,然后将得到的原始时频图像缩放至预设尺寸,得到时频图像;将各个时频图像的状态标签设置为对应的状态编码k,k=0表示正常状态,k=1 , 2 ,…,K表示故障状态序号;
2)构建残差‑胶囊网络,包括卷积模块、残差模块、注意力模块和胶囊模块,其中:卷积模块用于对输入的时频图像进行卷积操作,实现特征提取和数据降维,将得到的特征图输出至残差模块;残差模块用于对接收到的特征图进行处理,将得到的特征图输出至注意力模块;注意力模块用于对接收到的特征图采用通道注意力机制获取通道特征权值,然后根据所得到的通道特征权值对输入特征图进行特征重分配,将生成的特征图发送至胶囊层;胶囊模块用于根据接收到的特征图估计输入的时频图像对应的故障状态;胶囊模块包括主胶囊层、数字胶囊层和输出层,其中:主胶囊层用于对来自注意力模块的特征图进行特征提取,将得到的特征图输出至数字胶囊层;数字胶囊层包括K+1个数字胶囊,每个数字胶囊分别对接收到的特征图进行特征提取得到一个一维向量,将得到的K+1个一维向量输出至输出层;输出层用于对接收到的K+1个一维向量进行压缩,即求取对应数字胶囊的模长,得到输入时频图像属于K+1个状态的概率值;
3)采用步骤S1中得到的每个时频图像作为输入,对应的故障状态标签作为期望输出,
对步骤S2构建的残差
‑
胶囊网络进行训练,得到训练好的残差
‑
胶囊网络;
当需要对行星齿轮箱进行故障诊断时,采集时长为T的时域振动信号,采用步骤1
中的相同方法进行时频图像转换和缩放,将得到的时频图像输入训练好的残差
‑
胶囊网络,
得到故障诊断结果。
2.卷积模块。
![](https://img-blog.csdnimg.cn/4c4a97335c7b438a87ea84c5dbcd5010.png)
包括第一卷积层、池化层和第二卷积层,其中第一卷积层使用大小为7x7的卷积核对输入的时频图像进行卷积,步长为2,将得到的特征图输出到池化层;池化层对输入的特征图采用3x3的最大池化方式进行池化,池化步长为2,将得到的特征图输出至第二卷积层;第二卷积层采用1x1的卷积核进行卷积,卷积步长为1,将得到的特征图作为卷积模块的特征图进行输出。
3.残差卷积模块。
![](https://img-blog.csdnimg.cn/5af9c3092e3d472a8be2890b42885bb6.png)
包括第一卷积层、分块卷积层、连接层和第二卷积层。第一卷积层用于接收对特征图采用大小为1x1的卷积核进行卷积,将得到的特征图分别输出至分块卷积层和第二卷积层;分块卷积层用于将接收到的特征图按照通道进行4路拆分,将得到的4路特征分别记为为X1、X2、X3、X4,经过分块卷积层处理得到4路特征Y1、Y2、Y3、Y4,具体方法为:特征Y1等于X1;特征Y2由特征X2依次经过两个大小为1*3和3*1的卷积核进行卷积处理得到;特征Y3由特征X3和特征Y2相加后依次经过两个大小为1*3和3*1的卷积核进行卷积处理得到;特征Y4由特征X4和特征Y3相加后依次经过两个大小为1*3和3*1的卷积核进行卷积处理得到;将4路特征Y1、Y2、Y3、Y4输出至连接层;连接层用于对接收到的4路特征进行拼接得到特征图并发送至第二卷积层;第二卷积层将接收到的两个特征图相加后进行激活处理,将得到的特征图作为残差模块的特征图进行输出。
4残差-胶囊网络的参数配置
![](https://img-blog.csdnimg.cn/06e5edd5c0124025978962a4884b9e10.png)
![](https://img-blog.csdnimg.cn/9d4173fc95334b609ac15afb007ccd1a.png)