知名人工智能研究员、畅销书《Python 机器学习》的作者 Sebastian Raschka 最近又有一本新书出版 Build a Large Language Model from Scratch !
这份完整版的《Build a Large Language Model from Scratch》已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
👉 福利来袭
CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈
这本书讲解了从头构建大语言模型的全过程,包括如何创建、训练和调整大语言模型!
Sebastian Raschka 在 GitHub 开源了该书代码库,目前已有 42k 的 Star 数。原书刚刚出版不久,关注度已经超级高了。美亚评分更是高达 4.7 分。
项目地址:
https://github.com/rasbt/LLMs-from-scratch
在 Build a Large Language Model (From Scratch) 这本书中,作者通过简明的文字、直观的图表和具体的实例,逐步揭示了构建大语言模型(LLM)的全过程。
Sebastian Raschka 以深入浅出的方式,从最初的设计和创建,到使用通用语料库进行预训练,直至针对特定任务进行微调,带领读者深刻理解 LLM 的内部工作原理。
对于任何希望在 AI 领域深入发展的学习者来说,这本书无疑是一本不可或缺的参考书籍。
书中具体讲解了如何:
- 规划和编码 LLM 的所有部分;
- 准备适合 LLM 训练的数据集;
- 使用自己的数据微调 LLM;
- 应用指令调整方法来确保 LLM 遵循指令;
- 将预训练权重加载到 LLM 中。
以下为本书目录:
本书评价
Sebastian Raschka @rasbt 所著的 Build a Large Language Model (From Scratch) 对我来说是一份宝贵的资源,它连接了许多点,并激发了无数的“啊哈”时刻。这本书强烈推荐给那些希望了解大语言模型实践经验的人。
——Faisal Alsrheed,AI 研究员
在学习新概念时,如果我能从头开始就自己写代码实现,这会让我在理解和学习知识的过程中更有信心。大多数教程倾向于涵盖高层次的概念,而忽略了一些细节,当你尝试将这些概念转化为代码时,这些细节的缺失就会明显感觉到。这就是为什么我非常欣赏 Sebastian Raschka 博士的最新书籍 Build a Large Language Model (From Scratch) 。
在大多数 LLM 实现倾向于使用高级包(如transformers, timm)的时代,看到通过使用基本的 PyTorch 元素逐步开发 LLM 的核心构建块,真是令人耳目一新。这也让你意识到,一些最先进的 LLM 的核心构建块可以简化为相对简单的概念。
——Roshan Santhosh,Meta 数据科学家
关于作者
Sebastian Raschka 从事机器学习和人工智能研究已有十多年。2022 年,Sebastian 加入了 Lightning AI,目前专注于人工智能和大语言模型(LLM)的研究、开发开源软件以及撰写图书。
在此之前,Sebastian 在威斯康星大学麦迪逊分校统计系担任助理教授,专注于深度学习和机器学习研究。他对教育充满热情,并且以其使用开源软件撰写的机器学习畅销书籍而广为人知。
这份完整版的《Build a Large Language Model from Scratch》已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】