【新书】构建大型语言模型,教你学习如何从零开始创建、训练和调整大型语言模型(LLMs),附370页pdf

在《从零构建大型语言模型》一书中,畅销书作者塞巴斯蒂安·拉什卡(Sebastian Raschka)将一步步指导你创建自己的LLM。每个阶段都有清晰的文字、图表和示例解释。从最初的设计和创建,到基于通用语料库的预训练,再到为特定任务进行微调,你将全面掌握每个步骤。

《从零构建大型语言模型》教你如何:

  • 规划和编写LLM的所有组件代码

  • 准备适合LLM训练的数据集

  • 为文本分类及自有数据微调LLM

  • 使用人类反馈确保LLM遵循指令

  • 将预训练的权重加载到LLM中

《从零构建大型语言模型》将带你深入AI的“黑箱”,让你调整生成式AI的内部系统。在LLM创建的每个关键阶段,你将深入理解LLM的工作原理、它们的局限性以及它们的定制方法。你可以在普通笔记本电脑上开发LLM,并将其用作个人助手。

关于技术

据说物理学家理查德·费曼(Richard P. Feynman)曾表示:“我无法理解任何我不能自己构建的东西。”基于这一强大的原则,畅销书作者塞巴斯蒂安·拉什卡将引导你逐步构建一个GPT风格的LLM,它可以在你的笔记本电脑上运行。这是一本引人入胜的书籍,涵盖了从规划、编码到训练和微调的每个阶段。

关于本书

《从零构建大型语言模型》是一段充满实践性和成就感的动手旅程,深入探索生成式AI的基础。在不依赖任何现有LLM库的情况下,你将编写一个基础模型,将其发展为文本分类器,最终创建一个可以按照对话指令进行交互的聊天机器人。而且你会真正理解它,因为你是自己构建的!

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

### 书中内容
  • 规划并编写一个与GPT-2相当的LLM

  • 加载预训练权重

  • 构建完整的训练管道

  • 为文本分类微调LLM

  • 开发遵循人类指令的LLM

读者对象

读者需要具备中级的Python技能和一些机器学习知识。你所创建的LLM可以在任何现代笔记本电脑上运行,并且可以选择使用GPU。

作者简介

塞巴斯蒂安·拉什卡(Sebastian Raschka)是Lightning AI的研究工程师,专注于LLM研究并开发开源软件。

本书的技术编辑是大卫·卡斯韦尔(David Caswell)。

目录

  1. 了解大型语言模型

  2. 处理文本数据

  3. 编写注意力机制

  4. 从零实现GPT模型生成文本

  5. 在无标签数据上进行预训练

  6. 为分类进行微调

  7. 为遵循指令进行微调
    附录A PyTorch简介
    附录B 参考文献和延伸阅读
    附录C 习题答案
    附录D 为训练循环增加附加功能
    附录E 使用LoRA进行参数高效微调



在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值