AI技术干货|大语言模型知识大全!从入门到精通,通俗易懂!|附391页PDF文件下载

前言

本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微 调与对齐部分、大模型使用部分以及评测与应用部分,按照如下的内容组织进行 设置:

在这里插入图片描述

背景与基础知识部分

  • 第 2 章将首先介绍大语言模型的构建过程,随后介绍 大语言模型相关的背景知识以及重要概念,包括涌现能力、扩展定律以及二者之 间的联系与区别;进一步介绍 GPT 系列模型的发展历程以及各个阶段的重要技术 创新,从而能够更好地了解大语言模型的技术升级历史。
  • 第3 章将介绍目前大语 言模型相关的资源信息,包括公开可用的模型检查点与 API 、数据集合以及代码 工具库,为读者梳理与汇总相关资源。

预训练部分

  • 第 4 章将主要介绍预训练数据的准备工作,主要包括数据的收 集、清洗以及词元化方法,随后将介绍数据课程的设计方法。
  • 第 5 章将主要介绍 大语言模型的架构,主要包括 Transformer 模型、各种组件的详细配置、长文本建 模以及一些新型的模型架构。
  • 第 6 章将主要介绍预训练过程所涉及到的预训练任 务、优化参数设置、可扩展的训练技术以及参数量计算与效率分析方法,并通过 相关实战代码进行讲解。

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

微调与对齐部分

  • 第 7 章将主要介绍指令微调所涉及的数据构建、优化策 略;进一步将介绍典型的轻量化微调技术,减少模型训练的开销;并且通过实践 示例介绍指令微调的具体流程。
  • 第 8 章将主要介绍大模型的人类对齐技术,将以 RLHF 为主要方法进行详细介绍,并且进一步介绍非强化学习的对齐方法,最后 探讨 SFT 与 RLHF 之间的关系。

大模型使用部分

  • 第 9 章将主要介绍大模型的解码与部署方法,包括解码策 略、解码加速算法、低资源部署策略以及其他模型压缩方法。
  • 第 10 章将主要介绍 面向大语言模型的提示学习技术,包括基础的提示学习设计方法、上下文学习方 法以及思维链方法等。
  • 第 11 章将主要介绍面向复杂任务的规划技术,探索如何将 复杂任务进行有效分解,并通过回溯、反思等关键技术形成有效的解决方案;进 一步,将介绍如何构建基于大语言模型的智能体以及多智能体系统。

评测与应用部分

  • 第 12 章将主要介绍面向大语言模型性能的评测方法,针 对不同的能力维度介绍相关的评测集合、评测指标以及评测方法,并且指出大语 言模型目前存在的问题。
  • 第 13 章将主要介绍大语言模型的应用情况,具体将分别 从代表性的研究领域以及应用领域两个维度展开讨论,我们将以代表性工作为驱 动,使得读者能够了解如何将大语言模型进行领域特化以及任务特化。
  • 最后,第 14 章将对于全文的内容进行总结,进一步梳理目前每个部分存在的 技术挑战以及研究趋势。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值