首个中文版大语言模型综述来了!看完直接入门大模型(附PDF)

图片

从 2019 年的谷歌 T5 到 OpenAI GPT 系列,参数量爆炸的大模型不断涌现。尤其对话大模型 ChatGPT 的出现更是引起了社会各界的广泛关注。

图片

2023年人大发表的关于大语言模型的综述文章《A Survey of Large Language Models》,一发表便受到了不少读者的关注,一年就已经更新到了第13个版本,包含了83页的正文内容,并且收录了900多篇参考文献。

图片

在2024年4月,中国人民大学又对这篇综述的内容进行了大幅度的更新与重组后,正式发表了大语言模型的中文版入门书。与英文综述文章不同的是,中文版主要是展现一个整体的大模型技术框架和路线图,为大模型技术的入门读者提供系统的讲解。

图片

我已将这本大模型书籍还有重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

该书共 391 页,参考文献共 447 篇。一共分为五大部分,包括大模型基础、大模型预训练、大模型微调与对齐、大模型使用、大模型在研究领域的应用,帮助读者更好地了解大语言模型技术的核心知识点。

图片

在发布V1版本后的8个月时间内,为了提升该综述的质量,作者在持续更新相关的内容,连续进行了多版的内容修订(版本号目前迭代到V13),中文版目前已经对应更新到了 V10 版本,并将持续更新增加了许多亮点。

图片

不仅如此,作者还为大家准备了两个配套资源。

  • LLMBox:

LLMBox是一个全面的代码工具库,专门用于开发和实现大语言模型,其基于统一化的训练流程和全面的模型评估框架。

图片

  • YuLan大模型:

YuLan系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型(名字"玉兰"取自中国人民大学校花)。最新版本从头完成了整个预训练过程,并采用课程学习技术基于中英文双语数据进行有监督微调,包括高质量指令和人类偏好数据。

图片

**
**

全书章节组织:

一、背景与基础知识

第一章 引言(大模型发展历程、重要技术概览)

第二章 基础介绍(Scaling Law、GPT系列模型发展历程)

第三章 大模型资源(开源模型、数据、代码库)

二、预训练

第四章 数据准备(数据收集、清洗、配比、课程方法)

第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)

第六章 模型预训练(预训练任务、优化参数设置、并行训练方法)

三、微调与对齐

第七章 指令微调(指令数据收集与合成方法、指令微调策略与作用)

第八章 人类对齐(3H标准、RLHF算法、非RL算法)

四、大模型使用

第九章 解码与部署(解码生成算法、解码加速算法、模型压缩算法)

第十章 提示学习(基础提示方法、上下文学习、思维链)

第十一章 规划与智能体(复杂规划方法、智能体搭建方法)

五、评测与应用

第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)

第十三章 应用(概览研究领域与专业领域的应用)

我已将这本大模型书籍还有重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

  • 10
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值