AAAI2021最佳论文InFormer阅读

最新推荐文章于 2023-12-22 21:30:23 发布

前方是海洋

最新推荐文章于 2023-12-22 21:30:23 发布

阅读量519

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35780315/article/details/117259850

版权

本文根据作者在AIDrive上的分享和自己对论文的一些理解，整理而成。

这篇论文主要解决长序列预测问题。

作者认为以前的很多工作其实关注的是长序列输入学习问题（Long Sequence Input Learning Problem)，更关心在输入上的表征，更注重加强模型在处理大量输入时的能力
在这里插入图片描述
而长序列预测问题，更关心输出的准确性，最主要的事情是建立长序列输入和长序列输出的映射或者Attention

Motivation:为什么要选择注意力机制
Attention机制在处理信息时不会关注全局信息，而是关注更加值得注意的部分

Transformer使用自注意力机制
Transformer能否用于长序列预测问题？

原生Transformer无法支持长序列输入和长序列输出，在计算Attention会计算点和所有点之间的距离，复杂度很高
在这里插入图片描述
所以怎么做到让类Transformer模型处理长序列预测问题

自注意力机制的原子操作，使得时间复杂度和内存使用率为o(l2)------复杂度
内存开销出现瓶颈

最低0.47元/天解锁文章

前方是海洋

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
AAAI2021最佳论文InFormer阅读

本文根据作者在AIDrive上的分享和自己对论文的一些理解，整理而成。这篇论文主要解决长序列预测问题。作者认为以前的很多工作其实关注的是长序列输入学习问题（Long Sequence Input Learning Problem)，更关心在输入上的表征，更注重加强模型在处理大量输入时的能力而长序列预测问题，更关心输出的准确性，最主要的事情是建立长序列输入和长序列输出的映射或者AttentionMotivation:为什么要选择注意力机制Attention机制在处理信息时不会关注全局信息，而是关
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。