AMiner论文推荐

AMiner学术搜索和科技情报挖掘

于 2021-09-15 15:27:44 发布

阅读量109

点赞数

分类专栏： AMiner论文推荐 AMiner 文章标签：深度学习自然语言处理 python

本文链接：https://blog.csdn.net/AI_Conf/article/details/120309612

版权

AMiner 同时被 2 个专栏收录

729 篇文章 45 订阅

订阅专栏

AMiner论文推荐

515 篇文章 52 订阅

订阅专栏

论文标题：PermuteFormer: Efficient Relative Position Encoding for Long Sequences
论文链接：https://www.aminer.cn/pub/6136d84a5244ab9dcb6aa8e8?f=cs
最近的 Transformer 变体 Performer 使用线性注意力机制将 Transformer 扩展到更长的序列。但是，这种方法与相对位置编码不兼容，而相对位置编码比绝对位置编码具有优势。在这篇论文中，作者讨论了向 Performer 添加相对位置编码的可能方法，提出了 PermuteFormer。
PermuteFormer 是一种基于 Performer 的模型，具有相对位置编码，可在长序列上线性缩放。PermuteFormer 对查询和键应用相关位置变换，将位置信息编码到注意力模块中。经过设计后，self-attention 的最终输出不受 token 绝对位置的影响。论文作者在长序列数据集 Long-Range Arena 以及语言建模数据集 WikiText-103 上评估 PermuteFormer。
实验表明，PermuteFormer 在几乎没有计算开销的情况下一致地提高了 Performer 的性能，并且在大多数任务上都优于 vanilla Transformer。
AMiner,让AI帮你理解科学！
在这里插入图片描述