GitHub 42k Star项目,全网疯传的大模型神书,还学不会算我输!

知名人工智能研究员、畅销书《Python 机器学习》的作者 Sebastian Raschka 最近又有一本新书出版 Build a Large Language Model from Scratch

图片

这份完整版的《Build a Large Language Model from Scratch》已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

这本书讲解了从头构建大语言模型的全过程,包括如何创建、训练和调整大语言模型!

Sebastian Raschka 在 GitHub 开源了该书代码库,目前已有 42k 的 Star 数。原书刚刚出版不久,关注度已经超级高了。美亚评分更是高达 4.7 分。

项目地址:

https://github.com/rasbt/LLMs-from-scratch

img

图片

Build a Large Language Model (From Scratch) 这本书中,作者通过简明的文字、直观的图表和具体的实例,逐步揭示了构建大语言模型(LLM)的全过程。

Sebastian Raschka 以深入浅出的方式,从最初的设计和创建,到使用通用语料库进行预训练,直至针对特定任务进行微调,带领读者深刻理解 LLM 的内部工作原理。

对于任何希望在 AI 领域深入发展的学习者来说,这本书无疑是一本不可或缺的参考书籍。

书中具体讲解了如何:

  • 规划和编码 LLM 的所有部分;
  • 准备适合 LLM 训练的数据集;
  • 使用自己的数据微调 LLM;
  • 应用指令调整方法来确保 LLM 遵循指令;
  • 将预训练权重加载到 LLM 中。

以下为本书目录:

图片

本书评价

Sebastian Raschka @rasbt 所著的 Build a Large Language Model (From Scratch) 对我来说是一份宝贵的资源,它连接了许多点,并激发了无数的“啊哈”时刻。这本书强烈推荐给那些希望了解大语言模型实践经验的人。

——Faisal Alsrheed,AI 研究员

在学习新概念时,如果我能从头开始就自己写代码实现,这会让我在理解和学习知识的过程中更有信心。大多数教程倾向于涵盖高层次的概念,而忽略了一些细节,当你尝试将这些概念转化为代码时,这些细节的缺失就会明显感觉到。这就是为什么我非常欣赏 Sebastian Raschka 博士的最新书籍 Build a Large Language Model (From Scratch) 。

在大多数 LLM 实现倾向于使用高级包(如transformers, timm)的时代,看到通过使用基本的 PyTorch 元素逐步开发 LLM 的核心构建块,真是令人耳目一新。这也让你意识到,一些最先进的 LLM 的核心构建块可以简化为相对简单的概念。

——Roshan Santhosh,Meta 数据科学家

关于作者

图片

Sebastian Raschka 从事机器学习和人工智能研究已有十多年。2022 年,Sebastian 加入了 Lightning AI,目前专注于人工智能和大语言模型(LLM)的研究、开发开源软件以及撰写图书。

在此之前,Sebastian 在威斯康星大学麦迪逊分校统计系担任助理教授,专注于深度学习和机器学习研究。他对教育充满热情,并且以其使用开源软件撰写的机器学习畅销书籍而广为人知。

这份完整版的《Build a Large Language Model from Scratch》已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

👉 福利来袭CSDN大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值