今天逛Github的时候看到一个很有意思的仓库--“从头训练大模型”,为什么说它有意思呢?因为作者表示这本书的所有操作都可以在笔记本电脑上完成,并不需要多大的算力!
于是我去查了一下这本书,发现它居然要2024年8月27号才发布!也就是说这本书居然在还没发布的情况下就爆火了!
这就立马让我对这本书期待不已,因为github上并没有PDF资源,所以我花了好长时间才才找到这本书的预印版,如果你需要的可以让我的小助手无偿分享给你~
这本书的作者一位实打实的大佬,不仅是威斯康星大学麦迪逊分校终身教授,还是《使用 PyTorch 和 Scikit-Learn 进行机器学习:使用 Python 开发机器学习和深度学习模型》这本机器学习好书的作者!在github、油管和推特上也拥有非常多的粉丝。
他最新的这本《构建大型语言模型(从头开始)》目前分为五个部分,第一部分介绍大模型的基础知识;第二部分会教你如何准备和处理用于训练的大模型文本数据;第三部分深入探讨了注意力机制的原理及其在LLM中的应用;到了第四部分你将学会如何从头构建一个GPT模型,并用于生成文本;第五部分则讨论了如何在没有标签的数据上进行预训练,让模型能够捕捉语言的复杂性和上下文关系。
整本书会在带你从0构建和训练大模型的过程中,彻底了解大模型的实现细节和工作原理!
— end —