今天发现一本不错的综述
可以作为入门大模型技术的书籍
01
你一定在各类研报、文章等渠道中看过这张图,而它就出自这篇综述。
- 综述爆火,如今更新到第 13 个版本,包含了 83 页的正文内容,并收录了 900 余篇参考文献。
论文地址:https://arxiv.org/abs/2303.18223
- 在 2023 年 12 月底启动了中文书的编写工作,并且于 2024 年 4 月 15 日左右完成初稿。
项目地址:https://llmbook-zh.github.io/
02
该书共 391 页,参考文献共 447 篇,旨在为对大模型技术感兴趣的初学者提供全面介绍,展示整体框架和发展方向。
该书一共五大部分,包括大模型基础、大模型预训练、大模型微调、提示词、智能体、大模型在研究/专业领域的应用等。
里面有非常多精彩的解读与数据整理,比如 LLaMA 系列模型衍生工作进化图。
比如混合专家模型的介绍。
也有当下热门的智能体(Agent)相关介绍。
再比如各专业领域内代表性的大语言模型与数据资源。
希望通过阅读本书,大家能够深入了解大模型技术的现状和未来趋势,为自己的研究和实践提供指导和启发。