点击上方,选择星标,每天给你送干货!
转载自:AI公园
作者:Elvis
编译:ronghuaiyang
导读
从浅入深学习Transformer的资料汇总。
Transformers 加速了自然语言处理(NLP)任务的新技术和模型的发展。虽然它主要用于NLP任务,但现在它被大量应用于处理计算机视觉任务。这使它成为一个非常重要的技术。
我知道很多机器学习和NLP的学生和从业者都非常热衷于学习Transformers 。因此,我保存了一份资源和学习材料的配方,帮助学生了解Transformers的世界。
首先,在这篇文章中,我准备了一些材料链接,用于更好地从头开始理解和实现transformer模型。
写这篇文章的原因是这样我就可以有一个简单的方法来继续更新学习材料。
???? 高层次介绍
首先,关于Transformers的非常高层次的介绍。一些值得一看的参考资料:
???? https://theaisummer.com/transformer/
???? https://hannes-stark.com/assets/transformer_survey.pdf
???? Transformer 图解
Jay Alammar)的解释很特别。一旦你对Transformer有了高层次的理解,你就可以跳到下面这个流行的关于Transformer的图解说明:
???? http://jalammar.github.io/illustrated-transformer/
???? 技术汇总
此时,你可能正在寻找Transformers的技术摘要和概述。Lilian Weng的博文是一个宝藏,提供了简洁的技术解释/总结:
???? https://lilianweng.github.io/lil-log/2020/04/07/the-transformer-family.html
???????????? 实现
理论之后,检验知识是很重要的。我通常喜欢更详细地理解事物,所以我更喜欢从头开始实现算法。对于实现Transformers,我主要依赖于这个教程:
???? https://nlp.seas.harvard.edu/2018/04/03/attention.html
???? Attention Is All You Need
本文由Vaswani等人介绍了Transformer 的结构。在你有一个高层次的理解和想要进入细节后再读它。为了深入研究,请注意论文中的其他参考文献。
???? https://arxiv.org/pdf/1706.03762v5.pdf
???????????? 应用 Transformers
在学习和理解Transformers背后的理论一段时间后,你可能会有兴趣将它们应用到不同的NLP项目或研究中。现在,你最好的选择是HuggingFace的Transformers库。
???? https://github.com/huggingface/transformers
英文原文:https://elvissaravia.substack.com/p/learn-about-transformers-a-recipe
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
整理不易,还望给个在看!