大模型书籍丨人大赵鑫教授出书《大语言模型》,第一本中文大语言模型教程!

今天和大家分享下近期读《大语言模型》一书的学习笔记, 由于笔者能力&时间有限,笔记不足之处在所难免,恳请大家批评指正, 可留言或私信或Github上提issue。

导语: 今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。

本文整理了该书的学习笔记, 并以思维导图形式记录了全书各章节知识点, 希望可进一步加深对大语言模型全貌的理解。

一些示例

这里仅以第一、二章节为例, 其它章节内容更加详实。

在这里插入图片描述

第一章 引言 思维导图

在这里插入图片描述

第二章 基础介绍 思维导图

全书章节组织及思维导图链接:

一、背景与基础知识

第一章 引言(大模型发展历程、重要技术概览) 第1章 思维导图
第二章 基础介绍(Scaling Law、GPT系列模型发展历程)第2章 思维导图
第三章 大模型资源(开源模型、数据、代码库)第3章 思维导图

二、预训练

第四章 数据准备(数据收集、清洗、配比、课程方法)第4章 思维导图
第五章 模型架构(Transformer 结构、大模型主流架构、细节改进)第5章 思维导图
第六章 模型预训练(预训练任务、优化参数设置、并行训练方法)第6章 思维导图

三、微调与对齐

第七章 指令微调(指令数据收集与合成方法、指令微调策略与作用)第7章 思维导图
第八章 人类对齐(3H标准、RLHF算法、非RL算法)第8章 思维导图

四、大模型使用

第九章 解码与部署(解码生成算法、解码加速算法、模型压缩算法)第9章 思维导图
第十章 提示学习(基础提示方法、上下文学习、思维链)第10章 思维导图
第十一章 规划与智能体(复杂规划方法、智能体搭建方法)第11章 思维导图

五、评测与应用

第十二章评测(评测指标与方法、基础与高级能力评测、评测体系)第12章 思维导图
第十三章 应用(概览研究领域与专业领域的应用)第13章 思维导图
第十四章 总结 第14章 思维导图

在这里插入图片描述

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值