改进胶囊网络的滚动轴承故障诊断方法（学习笔记）

最新推荐文章于 2022-09-26 19:09:29 发布

哦我就想贝佳斯

最新推荐文章于 2022-09-26 19:09:29 发布

阅读量963

点赞数

分类专栏：胶囊网络故障诊断文章标签：深度学习神经网络人工智能

本文链接：https://blog.csdn.net/qq_45549605/article/details/126742179

版权

胶囊网络同时被 2 个专栏收录

8 篇文章 3 订阅

订阅专栏

故障诊断

8 篇文章 1 订阅

订阅专栏

摘要：文章中提出一种改进胶囊网络特征提取结构和反向传播损失计算方法的滚动轴承故障诊断模型，应用多尺度卷积核Inception结构和空间注意力机制替代传统胶囊网络单一卷积层进行特征提取，得到不同尺度下、重点区域突出的特征数据，利用胶囊结构构建向量神经元，通过动态路由的特征传递方式，得到分类结构数字胶囊，实现故障诊断。

一、Inception结构

Inception结构是一种高效表达特征的稀疏性结构。基于底层的相关性高的单元，通常会聚集在局部区域（通常CNN底层卷积提取的都是局部特征），这就相当于在单个局部区域上，去学习他的特征，然后在高层用l1卷积代替这个区域，当然某些相关性可能是隔得比较远的，通过使用大的卷积核学习即可。

原始Inception结构如下：

Inception v1结构：

原始Inception结构中所有卷积核都在上一层的所有输出上来做，5*5的卷积核所需要的计算量太大，造成了特征图的厚度很大，为并避免这种情况，在3x3前、5x5前、max pooling后分别加上1x1的卷积核，以起到降低特征图厚度的作用，这就形成了Inception v1的网路结构。相比于原始Inception结构，v1结构的计算量大大减小。

以上图片取自于：详解Inception结构：从Inception v1到Xception_红鲤鱼与绿驴的博客-CSDN博客_inception结构详细介绍了GoogLeNet中Inception模块网络结构的发展历程，包括了Inception v1，Inception v2，Inception v3，Inception v4，Xception结构及特点。https://blog.csdn.net/weixin_44772440/article/details/122952961?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166252546616782390518608%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=166252546616782390518608&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-2-122952961-null-null.142%5Ev47%5Epc_rank_34_1,201%5Ev3%5Econtrol&utm_term=inception%E7%BB%93%E6%9E%84%E5%9B%BE&spm=1018.2226.3001.4187

二、注意力机制（代码实现）

注意力机制模仿人观察事物关注重点部位的特点，广泛应用于图像识别、自然语言处理等领域。注意力机制可以分为通道注意力机制、空间注意力机制以及二者结合。常见的实现方式有SENet，CBAM，ECA等。

2.1通道注意力模块

首先通过平均池化和最大池化（用来汇总特征图的空间信息）得到平均池化特征 $F_{avg}^{C}$ 和最大池化特征 $F_{max}^{C}$ ，然后将两个池化特征传入共享网络（SharedMPL：有一个隐含层）生成通道注意力特征图 $M_{C}\in R^{C*1*1}$ ，隐含层的激活大小设置为 $R^{C/r*1*1}$ ,r为缩减率，经过共享网络后得到的结果，通过元素的求和并输出特征向量。

通道注意力公式为：

$\sigma$ 是sigmoid函数。MPL的权重 $\vec{W_{0}}$ 和 $\vec{W_{1}}$ 对于两个输入是共享的， $\vec{W_{0}}$ 后面是ReLu激活函数。

2.2空间注意力模块

首先沿着通道轴进行平均池化 $F_{avg}^{s}\in R^{1*H*W}$ 和最大池化 $F_{max}^{s}\in R^{1*H*W}$ 操作，并将它们连接起来生成一个有效特征描述符（每个都表示整个通道的平均池化和最大池化特征）。在连通的特征描述符上，经过一个7x7的卷积层，激活函数为Sigmoid生成二维空间注意图（权重系数） $M_{s}(F)\in R^{H*W}$ ，将权重系数与特征 $F'$ 相乘即可得到缩放后的先特征从而对原特征进行了强调或抑制。