LSTM最近真是赚足了眼球,前有大幅领先Transformer和Mamba的xLSTM,后有视觉领域新宠Vision-LSTM,这俩都出自原作者之手,实力上演现实版“重生之夺回一切”。
自从它们火了之后,这类LSTM改进变体也成了论文界香饽饽,相关研究数目繁多,也给我们处理序列数据提供了更多选择和灵感启发。
当然,除了LSTM本身的变体,还有一个LSTM的创新思路也很热门:LSTM与其他技术结合。比如我之前写过的LSTM+Transformer、+GNN、+注意力机制、+ResNet、+CNN、