今天来推荐一本Transformers宝典《Transformers for Machine Learning》,它现在在亚马逊上卖140美元。
全书共有60多种Transformer架构的讲解,还有相关的知识和技巧,不管你是搞语音、文本、时间序列还是计算机视觉的,都能用得上。只要你有本科的基础知识,读起来就毫无压力!
第一章先带你回顾一下Transformer架构的发展历史,看看它怎么影响学术界和工业界的。
第二章就深入聊聊序列到序列模型,还有它的一些局限性。然后重点讲解Transformer的各种组件,像注意力机制、多头注意力、位置编码这些,都讲得很清楚,你一看就懂。
第三章专门讲Bert架构,告诉你怎么对NLP任务进行预训练和微调。
后面的章节还介绍了各种基于Transformer的变体模型,以及它们在不同领域的应用。还有Transformer的可解释性技术,也都给你讲明白了。书里的案例和代码都能在谷歌Colab上直接跑,特别方便。
总之,这本书就是Transformer架构的百科全书,不管你是初学者还是有一定基础的,都值得一读。强烈推荐给大家!
关注下方《学姐带你玩AI》🚀🚀🚀
回复“顶流神书”获取书籍PDF
码字不易,欢迎大家点赞评论收藏