这篇文章是自己以前在摸索方向的时候看的第三篇文章,之所以现在才整理出来是因为我发现Transformer这个大模型确确实实很值得一看。我本人代码方面较弱,但理论基础还可以,故希望自己的PPT能给大家一点学习帮助。如果有错,请大家留言指正,谢谢。
Attention is all you need
最新推荐文章于 2024-04-18 12:44:56 发布
这篇文章是自己以前在摸索方向的时候看的第三篇文章,之所以现在才整理出来是因为我发现Transformer这个大模型确确实实很值得一看。我本人代码方面较弱,但理论基础还可以,故希望自己的PPT能给大家一点学习帮助。如果有错,请大家留言指正,谢谢。