【新书】构建大型语言模型，教你学习如何从零开始创建、训练和调整大型语言模型（LLMs），附370页pdf

嘴巴吃糖了

于 2024-10-06 11:17:59 发布

阅读量145

点赞数 2

文章标签：语言模型学习 pdf 人工智能 agi ai LLM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YoungOne2333/article/details/142724656

版权

在《从零构建大型语言模型》一书中，畅销书作者塞巴斯蒂安·拉什卡（Sebastian Raschka）将一步步指导你创建自己的LLM。每个阶段都有清晰的文字、图表和示例解释。从最初的设计和创建，到基于通用语料库的预训练，再到为特定任务进行微调，你将全面掌握每个步骤。

《从零构建大型语言模型》教你如何：

规划和编写LLM的所有组件代码
准备适合LLM训练的数据集
为文本分类及自有数据微调LLM
使用人类反馈确保LLM遵循指令
将预训练的权重加载到LLM中

《从零构建大型语言模型》将带你深入AI的“黑箱”，让你调整生成式AI的内部系统。在LLM创建的每个关键阶段，你将深入理解LLM的工作原理、它们的局限性以及它们的定制方法。你可以在普通笔记本电脑上开发LLM，并将其用作个人助手。

关于技术

据说物理学家理查德·费曼（Richard P. Feynman）曾表示：“我无法理解任何我不能自己构建的东西。”基于这一强大的原则，畅销书作者塞巴斯蒂安·拉什卡将引导你逐步构建一个GPT风格的LLM，它可以在你的笔记本电脑上运行。这是一本引人入胜的书籍，涵盖了从规划、编码到训练和微调的每个阶段。

关于本书

《从零构建大型语言模型》是一段充满实践性和成就感的动手旅程，深入探索生成式AI的基础。在不依赖任何现有LLM库的情况下，你将编写一个基础模型，将其发展为文本分类器，最终创建一个可以按照对话指令进行交互的聊天机器人。而且你会真正理解它，因为你是自己构建的！

下载当前版本：完整PDF书籍链接获取，可以扫描下方二维码免费领取👇👇👇

### 书中内容

规划并编写一个与GPT-2相当的LLM
加载预训练权重
构建完整的训练管道
为文本分类微调LLM
开发遵循人类指令的LLM

读者对象

读者需要具备中级的Python技能和一些机器学习知识。你所创建的LLM可以在任何现代笔记本电脑上运行，并且可以选择使用GPU。

作者简介

塞巴斯蒂安·拉什卡（Sebastian Raschka）是Lightning AI的研究工程师，专注于LLM研究并开发开源软件。

本书的技术编辑是大卫·卡斯韦尔（David Caswell）。

目录

了解大型语言模型
处理文本数据
编写注意力机制
从零实现GPT模型生成文本
在无标签数据上进行预训练
为分类进行微调
为遵循指令进行微调
附录A PyTorch简介
附录B 参考文献和延伸阅读
附录C 习题答案
附录D 为训练循环增加附加功能
附录E 使用LoRA进行参数高效微调

在这里插入图片描述

下载当前版本：完整PDF书籍链接获取，可以扫描下方二维码免费领取👇👇👇

嘴巴吃糖了

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。