免费链接: Blogger(需翻Q)
文章目录
本文内容
本文基于李宏毅老师对 Self-Attention 的讲解,进行理解和补充,并结合Pytorch代码,最终目的是使得自己和各位读者更好的理解Self-Attention
李宏毅Self-Attention链接: https://www.youtube.com/watch?v=hYdO9CscNes
PPT链接见视频下方
通过本文的阅读,你可以获得以下知识:
- 什么是Self-Attention,为什么要用Self-Attention
- Self-Attention是如何做的
- Self-Attention是如何设计的
- Self-Attention公式的细节
- MultiHead Attention
- Masked Attention