【阅读笔记】《Self-attention with relative position representations》

最新推荐文章于 2023-11-15 15:51:09 发布

yetzirah

最新推荐文章于 2023-11-15 15:51:09 发布

阅读量256

点赞数

分类专栏：异常检测论文文章标签：深度学习机器学习人工智能 transformer 计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yetzirah/article/details/126767759

版权

异常检测论文专栏收录该内容

6 篇文章 1 订阅

订阅专栏

Self-attention with relative position representations

目录

Self-attention with relative position representations
一、Introduction
二、Self-attention
三、Relation-aware Self-Attention
四、Relative Position Representations
总结

一、Introduction

《attention is all you need》文章中使用绝对位置来表征位置信息，本文中使用相对位置对self-attention机制进行扩展。使用相对位置这个方法在翻译任务中取得了很大成果，并且实验得知将绝对位置与相对位置结合并不能进一步提高翻译质量。

二、Self-attention

老熟人了，query与key相乘得到weight，周围的不同点给予该点的attention不同，然后与value相乘得到该点学习global information后的结果。
在这里插入图片描述

三、Relation-aware Self-Attention

论文中通过扩展自我注意来考虑输入元素之间的成对关系。在这个意义上，可将输入建模为一个标记的、有向的、完全连接的图。
输入元素xi和xj之间的edge可用向量a_ij $^{V}$ 和a_ij $^{K}$ 来表示（da = dz，即a向量的维度与z相同），通过如下两个方程学习这两个位置向量，各自都不需要额外的linear transformations，这些representations可在不同attention heads之间共享。
在这里插入图片描述

a_ij $^{V}$ 和a_ij $^{K}$ 中蕴含了xi与xj间的相对位置信息，上述两个公式即为将可训练的这两个向量融入self-attention公式后的结果。

四、Relative Position Representations

假设精确的相对位置信息在一定距离之外是没有用的，设这个距离为k，使用如下公式进行该限制。
在这里插入图片描述

论文中给的一个栗子：

总结

好！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
【阅读笔记】《Self-attention with relative position representations》

论文《Self-attention with relative position representations》的阅读笔记
复制链接

扫一扫

专栏目录

yetzirah CSDN认证博客专家 CSDN认证企业博客

码龄5年

6: 原创

119万+: 周排名

105万+: 总排名

6842: 访问

: 等级

126: 积分

40: 粉丝

56: 获赞

8: 评论

73: 收藏

私信

关注

热门文章

分类专栏

异常检测论文 6篇

最新评论

ICLR 2024 | MuSc：基于无标签样本间互打分的零样本工业异常检测
CSDN-Ada助手: 恭喜您发布了第7篇博客，标题看起来非常吸引人！ICLR 2024 | MuSc：基于无标签样本间互打分的零样本工业异常检测，听起来非常专业和前沿。希望您能继续坚持创作，为读者带来更多有价值的内容。下一步，或许可以考虑深入探讨该方法在实际应用中的效果，并与其他相关研究进行比较分析，为读者提供更全面的视角。期待您的下一篇作品！
基于nexys4开发板的超声波测距设计
m0_74780492: 博主可以分享一下硬件平台的高清大图吗🥺
基于nexys4开发板的超声波测距设计
yetzirah: 完整项目： https://github.com/xrli-U/Microcomputer-principle-test 如果可以的话帮忙在github里点颗小星星~
【阅读笔记】《Self-attention with relative position representations》
謝堆堆DDD: 感谢感谢！清晰明了
【阅读笔记】《Self-attention with relative position representations》
yetzirah: 比如一张图有64×64像素，绝对位置就是左上角像素位置为1，右下角像素为4096，对这两个位置进行编码；相对像素就是右下角像素与左上角像素相距63行、63列，对这个进行编码

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。