交叉注意力融合时域、频域特征的FFT + CNN -BiLSTM-CrossAttention电能质量扰动识别模型

往期精彩内容:

电能质量扰动信号数据介绍与分类-Python实现-CSDN博客

Python电能质量扰动信号分类(一)基于LSTM模型的一维信号分类-CSDN博客

Python电能质量扰动信号分类(二)基于CNN模型的一维信号分类-CSDN博客

Python电能质量扰动信号分类(三)基于Transformer的一维信号分类模型-CSDN博客

Python电能质量扰动信号分类(四)基于CNN-BiLSTM的一维信号分类模型-CSDN博客

Python电能质量扰动信号分类(五)基于CNN-Transformer的一维信号分类模型-CSDN博客

基于FFT + CNN -Transformer时域、频域特征融合的电能质量扰动识别模型-CSDN博客

Python电能质量扰动信号分类(六)基于扰动信号特征提取的超强机器学习识别模型

创新点:利用交叉注意力机制融合模型!

前言

本文基于Python仿真的电能质量扰动信号,进行快速傅里叶变换(FFT)的介绍与数据预处理,最后通过Python实现基于FFT的CNN-BiLSTM-CrossAttention模型对电能质量扰动信号的分类。Python仿真电能质量扰动信号的详细介绍可以参考下文(文末附10分类数据集):

电能质量扰动信号数据介绍与分类-Python实现_python给电压数据做分类-CSDN博客

部分扰动信号类型波形图如下所示:

模型整体结构

模型整体结构如下所示,一维扰动信号经过FFT变换的频域特征以及信号本身的时域特征分别经过CNN卷积池化操作,提取全局特征,然后再经过BiLSTM提取时序特征,使用交叉注意力机制融合时域和频域的特征,通过计算注意力权重,使得模型更关注重要的特征再进行特征增强融合,最后经过全连接层和softmax输出分类结果。

时域和频域特征提取:

  • 对时域信号应用FFT,将信号转换到频域。

  • 利用CNN对频域特征进行学习和提取。CNN的卷积层可以捕捉频域特征的局部模式。

BiLSTM网络:

  • 将时域信号输入BiLSTM网络。BiLSTM(双向长短时记忆网络)可以有效地捕捉时域信号的长期依赖关系。

交叉注意力机制:

  • 使用交叉注意力机制融合时域和频域的特征。这可以通过计算注意力权重,使得模型更关注重要的特征

1 快速傅里叶变换FFT原理介绍

傅里叶变换是一种信号处理和频谱分析的工具,用于将一个信号从时间域转换到频率域。而快速傅里叶变换(FFT)是一种高效实现傅里叶变换的算法,特别适用于离散信号的处理。

第一步,导入部分数据,扰动信号可视化

第二步,扰动信号经过FFT可视化

电能质量扰动数据的预处理

2.1 导入数据

在参考IEEE Std1159-2019电能质量检测标准与相关文献的基础上构建了扰动信号的模型,生成包括正常信号在内的10中单一信号和多种复合扰动信号。参考之前的文章,进行扰动信号10分类的预处理:

第一步,按照公式模型生成单一信号

单一扰动信号可视化:

2.2 制作数据集

制作数据集与分类标签

3 交叉注意力机制

3.1 Cross attention概念

  • Transformer架构中混合两种不同嵌入序列的注意机制

  • 两个序列必须具有相同的维度

  • 两个序列可以是不同的模式形态(如:文本、声音、图像)

  • 一个序列作为输入的Q,定义了输出的序列长度,另一个序列提供输入的K&V

3.2 Cross-attention算法 

  • 拥有两个序列S1、S2

  • 计算S1的K、V

  • 计算S2的Q

  • 根据K和Q计算注意力矩阵

  • 将V应用于注意力矩阵

  • 输出的序列长度与S2一致

在融合过程中,我们将经过FFT变换的频域特征作为查询序列,时序特征作为键值对序列。通过计算查询序列与键值对序列之间的注意力权重,我们可以对不同特征之间的关联程度进行建模。

4 基于FFT+CNN-BiLSTM-CrossAttention扰动信号识别模型

4.1 网络定义模型

注意:输入故障信号数据形状为 [64, 1024], batch_size=64,  ,1024代表扰动信号序列长度。

4.2 设置参数,训练模型

50个epoch,准确率近100%,用FFT+CNN-BiLSTM-CrossAttention融合网络模型分类效果显著,模型能够充分提取电能质量扰动信号的空间和时序特征和频域特征,收敛速度快,性能优越,精度高,交叉注意力机制能够对不同特征之间的关联程度进行建模,从扰动信号频域、时域特征中属于提取出对模型识别重要的特征,效果明显。

4.3 模型评估

准确率、精确率、召回率、F1 Score

故障十分类混淆矩阵:

代码、数据如下:

对数据集和代码感兴趣的,可以关注最后一行

# 加载数据
import torch
from joblib import dump, load
import torch.utils.data as Data
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
# 参数与配置
torch.manual_seed(100)  # 设置随机种子,以使实验结果具有可重复性
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 
#代码和数据集:https://mbd.pub/o/bread/mbd-ZZ2Xl5hu

  • 39
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
CNN-LSTM模型在CWru轴承故障诊断中被广泛应用。CWru轴承故障诊断是指通过监测轴承的振动信号来检测和诊断轴承故障。传统的方法通常会使用傅里叶变换等技术来提取频谱特征,但由于其无法捕捉到时域和序列信息,因此很难准确地诊断轴承故障。 CNN-LSTM模型结合了卷积神经网络CNN)和长短期记忆网络(LSTM)的优点,为轴承故障诊断提供了更精确和准确的方法。 首先,CNN-LSTM模型使用CNN层来提取轴承振动信号的时域特征。通过卷积操作,模型能够捕捉到振动信号的局部特征。卷积核的滑动窗口可以有效地提取信号的时间段信息,从而更好地区分正常和故障状态。 接下来,LSTM层用于捕捉振动信号的序列特征。由于轴承信号具有时序性,LSTM模型能够对连续的振动信号序列进行建模。LSTM层通过学习轴承信号的长期依赖性,提取了更多的时序信息,提高了轴承故障的诊断准确性。 最后,通过连接CNN和LSTM层,CNN-LSTM模型能够同时捕捉到时域和序列信息,有效地提高了轴承故障诊断的精度。通过训练大量的正常和故障样本,模型学习到了振动信号的特征模式,并能够准确地判断轴承是否发生了故障。 总的来说,CNN-LSTM模型在CWru轴承故障诊断中的应用具有显著的优势。它能够从信号的时域和序列特征中提取有效的信息,并准确诊断轴承的故障状态。这种模型为轴承的预防性维护提供了有效的工具,能够降低故障率,提高设备的可靠性和工作效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

建模先锋

你的鼓励将是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值