GitHub开源大模型入门教程：零基础构建大语言模型，附赠书籍！-CSDN博客

本文链接：https://blog.csdn.net/2401_85343303/article/details/147830731

知名人工智能研究员、畅销书《Python 机器学习》的作者 Sebastian Raschka 最近又写了一本新书 Build a Large Language Model from Scratch ！
在这里插入图片描述
这本书讲解了从头构建大语言模型的全过程，包括如何创建、训练和调整大语言模型！

Sebastian Raschka 在 GitHub 开源了该书代码库，目前已有 20.9k 的 Star 数。虽然原书尚未出版，但关注度已经超级高了。许多读者和业内人士都想一睹为快。

重磅预告：没错！我们已经拿到这本书的版权！

在这里插入图片描述

在 Build a Large Language Model (From Scratch) 这本书中，作者通过简明的文字、直观的图表和具体的实例，逐步揭示了构建大语言模型（LLM）的全过程。

Sebastian Raschka 以深入浅出的方式，从最初的设计和创建，到使用通用语料库进行预训练，直至针对特定任务进行微调，带领读者深刻理解 LLM 的内部工作原理。

对于任何希望在 AI 领域深入发展的学习者来说，这本书无疑是一本不可或缺的参考书籍。

书中具体讲解了如何：

规划和编码 LLM 的所有部分；
准备适合 LLM 训练的数据集；
使用自己的数据微调 LLM；
应用指令调整方法来确保 LLM 遵循指令；
将预训练权重加载到 LLM 中。

以下为本书目录：

在这里插入图片描述

本书评价

Sebastian Raschka @rasbt 所著的 Build a Large Language Model (From Scratch) 对我来说是一份宝贵的资源，它连接了许多点，并激发了无数的“啊哈”时刻。这本书强烈推荐给那些希望了解大语言模型实践经验的人。

——Faisal Alsrheed，AI 研究员

在学习新概念时，如果我能从头开始就自己写代码实现，这会让我在理解和学习知识的过程中更有信心。大多数教程倾向于涵盖高层次的概念，而忽略了一些细节，当你尝试将这些概念转化为代码时，这些细节的缺失就会明显感觉到。这就是为什么我非常欣赏 Sebastian Raschka 博士的最新书籍 Build a Large Language Model (From Scratch) 。 在大多数 LLM 实现倾向于使用高级包（如transformers, timm）的时代，看到通过使用基本的 PyTorch 元素逐步开发 LLM 的核心构建块，真是令人耳目一新。这也让你意识到，一些最先进的 LLM 的核心构建块可以简化为相对简单的概念。

——Roshan Santhosh，Meta 数据科学家

关于作者

在这里插入图片描述

Sebastian Raschka 从事机器学习和人工智能研究已有十多年。2022 年，Sebastian 加入了 Lightning AI，目前专注于人工智能和大语言模型（LLM）的研究、开发开源软件以及撰写图书。

在此之前，Sebastian 在威斯康星大学麦迪逊分校统计系担任助理教授，专注于深度学习和机器学习研究。他对教育充满热情，并且以其使用开源软件撰写的机器学习畅销书籍而广为人知。

在这里插入图片描述

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述