2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

最新推荐文章于 2024-09-12 14:39:14 发布

泡椒竹笋面

最新推荐文章于 2024-09-12 14:39:14 发布

阅读量533

点赞数 4

文章标签：语言模型 pdf 人工智能大数据物联网开源自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kaka0722ww/article/details/140158344

版权

本书主要面向希望系统学习大语言模型技术的读者，将重点突出核心概念与

算法，并且配以示例与代码（伪代码）帮助读者理解特定算法的实现逻辑。由于大

语言模型技术的快速更迭，本书无法覆盖所有相关内容，旨在梳理最具代表性的

基础知识内容，帮助读者更好地了解大语言模型技术的核心知识点，能够快速上

手相关的科研与工程项目。为了配合本书的阅读与使用，我们创建了一个 GitHub

项目网站，该网站收集了关于大语言模型的相关资源，链接为 https://github.

com/RUCAIBox/LLMSurvey。

本书共设置了五个主要部分，分别是背景与基础知识部分、预训练部分、微

调与对齐部分、大模型使用部分以及评测与应用部分，按照如下的内容组织进行

设置：

• 背景与基础知识部分. 第 2 章将首先介绍大语言模型的构建过程，随后介绍

大语言模型相关的背景知识以及重要概念，包括涌现能力、扩展定律以及二者之

间的联系与区别；进一步介绍 GPT 系列模型的发展历程以及各个阶段的重要技术

创新，从而能够更好地了解大语言模型的技术升级历史。第 3 章将介绍目前大语

言模型相关的资源信息，包括公开可用的模型检查点与 API 、数据集合以及代码

工具库，为读者梳理与汇总相关资源。

131.5 本书的内容组织

• 预训练部分. 第 4 章将主要介绍预训练数据的准备工作，主要包括数据的收

集、清洗以及词元化方法，随后将介绍数据课程的设计方法。第 5 章将主要介绍

大语言模型的架构，主要包括 Transformer 模型、各种组件的详细配置、长文本建

模以及一些新型的模型架构。第 6 章将主要介绍预训练过程所涉及到的预训练任

务、优化参数设置、可扩展的训练技术以及参数量计算与效率分析方法，并通过

相关实战代码进行讲解。

• 微调与对齐部分. 第 7 章将主要介绍指令微调所涉及的数据构建、优化策

略；进一步将介绍典型的轻量化微调技术，减少模型训练的开销；并且通过实践

示例介绍指令微调的具体流程。第 8 章将主要介绍大模型的人类对齐技术，将以

RLHF 为主要方法进行详细介绍，并且进一步介绍非强化学习的对齐方法，最后

探讨 SFT 与 RLHF 之间的关系。

• 大模型使用部分. 第 9 章将主要介绍大模型的解码与部署方法，包括解码策

略、解码加速算法、低资源部署策略以及其他模型压缩方法。第 10 章将主要介绍

面向大语言模型的提示学习技术，包括基础的提示学习设计方法、上下文学习方

法以及思维链方法等。第 11 章将主要介绍面向复杂任务的规划技术，探索如何将

复杂任务进行有效分解，并通过回溯、反思等关键技术形成有效的解决方案；进

一步，将介绍如何构建基于大语言模型的智能体以及多智能体系统。

• 评测与应用部分. 第 12 章将主要介绍面向大语言模型性能的评测方法，针

对不同的能力维度介绍相关的评测集合、评测指标以及评测方法，并且指出大语

言模型目前存在的问题。第 13 章将主要介绍大语言模型的应用情况，具体将分别

从代表性的研究领域以及应用领域两个维度展开讨论，我们将以代表性工作为驱

动，使得读者能够了解如何将大语言模型进行领域特化以及任务特化。

最后，第 14 章将对于全文的内容进行总结，进一步梳理目前每个部分存在的

技术挑战以及研究趋势。

目录

本书内容截图

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

泡椒竹笋面

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。