入门Transformer的可以参考以下文章
中文翻译版本参考:https://zhuanlan.zhihu.com/p/54356280
进阶一下,参考哈佛大学NLP研究组写的:http://nlp.seas.harvard.edu/2018/04/03/attention.html 代码原理双管齐下。
入门Transformer的可以参考以下文章
中文翻译版本参考:https://zhuanlan.zhihu.com/p/54356280
进阶一下,参考哈佛大学NLP研究组写的:http://nlp.seas.harvard.edu/2018/04/03/attention.html 代码原理双管齐下。