Transformers资料汇总,从概要到原理到应用

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Elvis

编译:ronghuaiyang

导读

从浅入深学习Transformer的资料汇总。

Transformers 加速了自然语言处理(NLP)任务的新技术和模型的发展。虽然它主要用于NLP任务,但现在它被大量应用于处理计算机视觉任务。这使它成为一个非常重要的技术。

我知道很多机器学习和NLP的学生和从业者都非常热衷于学习Transformers 。因此,我保存了一份资源和学习材料的配方,帮助学生了解Transformers的世界。

首先,在这篇文章中,我准备了一些材料链接,用于更好地从头开始理解和实现transformer模型。

写这篇文章的原因是这样我就可以有一个简单的方法来继续更新学习材料。

???? 高层次介绍

首先,关于Transformers的非常高层次的介绍。一些值得一看的参考资料:

???? https://theaisummer.com/transformer/

???? https://hannes-stark.com/assets/transformer_survey.pdf

???? Transformer 图解

Jay Alammar)的解释很特别。一旦你对Transformer有了高层次的理解,你就可以跳到下面这个流行的关于Transformer的图解说明:

???? http://jalammar.github.io/illustrated-transformer/

???? 技术汇总

此时,你可能正在寻找Transformers的技术摘要和概述。Lilian Weng的博文是一个宝藏,提供了简洁的技术解释/总结:

???? https://lilianweng.github.io/lil-log/2020/04/07/the-transformer-family.html

????????‍???? 实现

理论之后,检验知识是很重要的。我通常喜欢更详细地理解事物,所以我更喜欢从头开始实现算法。对于实现Transformers,我主要依赖于这个教程:

???? https://nlp.seas.harvard.edu/2018/04/03/attention.html

???? Attention Is All You Need

本文由Vaswani等人介绍了Transformer 的结构。在你有一个高层次的理解和想要进入细节后再读它。为了深入研究,请注意论文中的其他参考文献。

???? https://arxiv.org/pdf/1706.03762v5.pdf

????????‍???? 应用 Transformers

在学习和理解Transformers背后的理论一段时间后,你可能会有兴趣将它们应用到不同的NLP项目或研究中。现在,你最好的选择是HuggingFace的Transformers库。

???? https://github.com/huggingface/transformers

—END—

英文原文:https://elvissaravia.substack.com/p/learn-about-transformers-a-recipe

请长按或扫描二维码关注本公众号

喜欢的话,请给我个在看吧

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值