Attention+LSTM+特征融合,时间序列预测的主流方法之一。这种结合的优势在于动态特征筛选与多源数据整合能力,特别适合处理复杂时序关系,在工业预测、金融股价预测等应用场景如鱼得水。
这方向目前也是中科院一区常客,比如ESWA上的CIR-DFENet框架、Energy and AI上的DGL-STFA、EAAI上的GD-CAF 模型...我从中挑选了14篇Attention+LSTM+特征融合新论文,整理好了原文PDF和代码,方便需要参考的同学找idea。
如果实在没思路,可以考虑往跨领域迁移、多模态融合、轻量化设计等突破,这方向创新性强、实验结果显著,感兴趣的同学抓紧冲了。
全部论文+开源代码需要的同学看文末
Multi-scale Quaternion CNN and BiGRU with Cross Self-attention Feature Fusion for Fault Diagnosis of Bearing
方法:论文提出了一种基于多尺度四元数卷积神经网络、双向门控循环单元和交叉自注意力特征融合的轴承故障诊断模型。该模型通过MQCNN提取多尺度特征,利用CSAFF增强特征融合效果,并借助BiGRU捕捉时间依赖性,最终实现高精度的故障分类。
创新点:
-
设计了多尺度四元数卷积模块,能够提取信号中更丰富的多尺度特征。
-
提出交叉自注意力特征融合模块,增强多尺度特征之间的交互和判别能力。
-
通过MQCNN、CSAFF和BiGRU的协同作用,实现从原始信号到故障分类的端到端诊断,具有高精度和强鲁棒性。
Attention-Based Acoustic Feature Fusion Network for Depression Detection
方法:论文提出了一种基于注意力机制和LSTM的声学特征融合网络,用于抑郁症检测。该模型融合了四种声学特征,通过权重调整模块进行特征融合,并利用LSTM和注意力机制处理时间序列信息,从而有效提升抑郁症检测的准确性和可靠性。
创新点:
-
提出了新颖的声学特征融合网络ABAFnet,结合四种声学特征并引入权重调整模块,实现多特征的动态融合。
-
引入注意力机制和LSTM,有效处理声学特征中的时间序列信息,增强模型对抑郁症的检测能力。
-
在两个临床语音数据库上验证了模型的有效性,显著提升了抑郁症检测和亚型分类的性能。
CIPF: Crossing Intention Prediction Network based on Feature Fusion Modules for Improving Pedestrian Safety
方法:论文提出了一种基于特征融合模块的行人横穿意图预测网络CIPF,通过将行人和车辆的八种输入特征分别输入到三个模块,并利用GRU层和注意力机制进行时间序列处理和特征聚焦,最终实现了高效的特征融合和准确的行人横穿意图预测。
创新点:
-
提出CIPF网络,融合行人和车辆的八种特征,通过三个模块分别处理非视觉和视觉特征,实现高效特征融合。
-
入注意力机制和GRU层,聚焦关键特征并处理时间序列信息,提升预测精度。
-
在PIE数据集上达到91%的准确率,显著优于现有方法,并通过实验验证了特征和编码器的有效性。
Audio-Visual Fusion for Emotion Recognition in the Valence-Arousal Space Using Joint Cross-Attention
方法:论文提出了一种基于联合交叉注意力的音频-视觉融合模型,用于情感识别。该模型通过深度学习提取音频和视觉特征,并利用JCA机制同时捕捉模态内和模态间的关系,同时结合多种特征提取网络进行特征融合,最终通过全连接层预测情感的愉悦度和唤醒度。
创新点:
-
提出联合交叉注意力模型,同时捕捉音频和视觉模态的内在及相互关系。
-
结合多种特征提取网络进行融合,提升情感识别能力。
-
在两个数据集上验证,模型优于现有方法,尤其在处理噪声或缺失模态时表现更好。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“222”获取全部方案+开源代码
码字不易,欢迎大家点赞评论收藏