LSTM玩出新花样!最新开源成果连超Transformer和Mamba,依然是发论文好选择

LSTM最近真是赚足了眼球,前有大幅领先Transformer和Mamba的xLSTM,后有视觉领域新宠Vision-LSTM,这俩都出自原作者之手,实力上演现实版“重生之夺回一切”。

自从它们火了之后,这类LSTM改进变体也成了论文界香饽饽,相关研究数目繁多,也给我们处理序列数据提供了更多选择和灵感启发。

当然,除了LSTM本身的变体,还有一个LSTM的创新思路也很热门:LSTM与其他技术结合。比如我之前写过的LSTM+Transformer+GNN+注意力机制+ResNet+CNN+GAN。这类结合可以提高模型性能、增强泛化能力,在各大实际应用场景中应用都很广泛。

因此,如果同学们想发论文,这俩比较热门但创新空间还很大的LSTM改进方向都可以考虑。我今天也整理好了25个最新的LSTM创新方案,包含LSTM变体和上述所提结合,开源代码已附,大家可以直接拿来参考。

论文原文+开源代码需要的同学看文末

LSTM变体

xLSTM: Extended Long Short-Term Memory

方法:论文介绍了一种扩展的长短期记忆网络xLSTM,通过引入新技术和改进现有LSTM结构,提升其在语言建模方面的性能,并与现有的大型语言模型(如基于Transformer的模型)竞争。

创新点:

  • 引入指数门控机制和两种新的记忆单元(sLSTM和mLSTM),分别采用标量和矩阵记忆,增强了模型的存储和处理能力。

  • 通过mLSTM的完全并行化处理和残差连接的使用,提高了模型的计算效率和学习能力。

  • 在大规模语言建模实验中,xLSTM显示出与现有最先进方法(如Transformer和SSM)相比具有竞争力的性能,并有潜力在更大的模型规模上实现更好的表现。

Vision-LSTM: xLSTM as Generic Vision Backbone

方法:论文介绍了Vision-LSTM(ViL),它是将xLSTM架构应用于计算机视觉的一种新型通用骨干。ViL的核心组件是一系列交替的xLSTM块,其中奇数块按行从左上到右下处理图像补丁,而偶数块从右下到左上。

创新点:

  • ViL使用了交替的mLSTM块来处理图像输入,其中奇数块从左上到右下按行处理图像块,偶数块从右下到左上按行处理图像块。

  • ViL的设计使得它能够高效地处理非连续的输入数据,如图像,并且具有线性的计算和内存复杂度。

  • ViL的性能在ImageNet-1K分类、ADE20K语义分割和VTAB-1K迁移分类等任务上表现优越,超过了基于SSMs和优化过的Transformer模型的性能。

  • ViL在处理高分辨率图像时具有优势,因为Transformer的自注意机制使得其计算复杂度呈二次增长,而ViL可以使用分块形式来平衡并行计算和递归计算的复杂度。

与其他技术结合

+Transformer

Learning-based NLOS Detection and Uncertainty Prediction of GNSS Observations with Transformer-Enhanced LSTM Network

方法:论文提出了一种基于Transformer增强的LSTM网络,用于检测GNSS观测的NLOS接收和预测伪距误差,并通过香港和Aachen的两个数据集对该网络进行了评估。

创新点:

  • 通过引入自注意力机制,作者提出了一种基于Transformer和LSTM网络的GNSS非直射路径(NLOS)分类和伪距误差预测方法。该方法能够有效地提取时空信息和上下文信息,并在数据分布不均衡或未见过的数据上表现出更好的泛化能力。

  • 通过进行消融研究,评估了模型不同组件的效果,并讨论了引入注意力机制和Bi-LSTM网络的影响。通过这种评估方法,作者证明了模型的设计假设,并得出了最优模型配置的结论。

+GAN

GAN‐LSTM‐3D: An efficient method for lung tumour 3D reconstruction enhanced by attention‐based LSTM

方法:论文提出了一种结合了生成对抗网络(GAN)和长短期记忆网络(LSTM)的3D重建方法,称为GAN-LSTM-3D,用于从2D CT图像中重建肺癌肿瘤的三维结构。该方法包括三个阶段:肺部和肿瘤的分割、特征提取和肺肿瘤的3D重建。

创新点:

  • 提出了一种新颖的GAN-LSTM-3D方法,首次将生成对抗网络(GAN)用于肺癌肿瘤的三维重建,同时利用长短期记忆网络(LSTM)结合注意力机制来增强特征提取和解包过程,提高了3D重建的质量。

  • 通过使用迁移学习技术结合预训练的VGG模型,以及优化的网络结构和训练策略,本文提出的方法在降低计算复杂度的同时,提供了更高的3D重建精度,特别是在LUNA数据集上的评估显示了其优越性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“LSTM创新”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值