论文略读:Memorization Capacity of Multi-Head Attention in Transformers

iclr spotlight reviewer评分 6888

  • 论文研究了一个具有H个头的单层多头注意力(MHA)模块的记忆容量
    • 它接受一个n×d token/上下文矩阵作为输入(n个token,每个token的embedding维度为d),以及一个d×1的查询向量
  • 论文首先引入了一组新的输入数据假设,与普适位置假设相比更为宽松
    • 第一个假设要求所有查询向量的Kruskal秩至少为n
    • 第二个假设需要每个示例的上下文向量线性独立
  • 在上述这组温和的假设下,论文证明了一个单层MHA模块
    • 这个模块具有H个头,嵌入维度d,key/query的维度 dh,value 维度dv,上下文大小n < d,输出维度dout ≤ dv
    • 也即一共有O(Hd(dh + dv))可训练参数
    • ——>能够记住Ω (H min(n, dh))个输入示例
      • ​​​​​​​不同注意力头在记住不同示例集时扮演不同角色——>每个头单独“负责”记住min(n, dh) - 1个示例
      • 通过利用softmax的饱和属性并引入特定的键-查询权重调整,为个别头设计了所需的softmax logits,同时确保对其他示例的干扰最小

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
根据引用\[1\],作者在入职后花了半个月的时间略读了《802.11无线网络》,现在打算进行精读,并做好笔记。作者表示此前读过的一些章节会迅速过掉,这次的重点是关注连接和验证的细节,而对于安全相关的内容不做精读。作者希望在精读过程中能够有特殊的感悟。 根据引用\[2\],802.11i是一项对安全性进行了大幅改善的协议,其中引入了强健安全网络(Robust Security Network)。为了让工作站之间能够交换安全性信息,开发了Extended Supported Rates和Wi-Fi Protected Access。 根据引用\[3\],在802.11协议中,广播和组播帧无需响应,而成帧和寻址较为复杂。组播帧无需分段,也无需得到确认,而单播帧则需要进行基本的肯定确认(最后一个片段)。帧分段是协议中的一个重要概念。 综上所述,802.11协议的精读将涉及连接和验证的细节,以及强健安全网络和Wi-Fi Protected Access的相关内容。同时,了解帧分段和成帧与寻址的复杂性也是重要的。 #### 引用[.reference_title] - *1* *2* [802.11协议精读(二)](https://blog.csdn.net/AngryDog1024/article/details/117464088)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [802.11协议精读(一)](https://blog.csdn.net/AngryDog1024/article/details/117464068)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UQI-LIUWJ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值