前言
人大的大模型系统教程终于出来了!一共391页的体量!
可以是说目前市面上第一本可以系统学习大模型的中文教程。
众所周知,OpenAI 团队很少在GPT 的 公开的材料中提到相关技术细节,其他大模型机构也是如此。所以学术界和初创企业对第一手的研究经验和知识的获取往往是相当受限的。
而人大的作者团队根据现有公开的资料,找出了其中“有章可循”的方法和原理,不仅讨论了大模型技术的当前状态,还系统地介绍了其发展历程、关键技术、以及未来的应用前景。
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇
这为读者提供了一个全面的理解框架,帮助他们识别和解决关键问题,对大模型的性能和优劣也能有很好的判断。
教程还配套了一个集成了各种实用的功能的工具库,包括各种训练策略,微调,和全面的模型评估框架。
作者怎么定义本书?
为了更好地整理和传播大模型技术的最新进展与技术体系,我们在2023年3月发表了大语言模型综述文章《A Survey of Large Language Models》,并不断进行更新完善。
这篇综述文章已经更新到第 13 个版本,包含了 83 页的正文内容,并收录了 900 余篇参考文献。自英文综述文章上线后,陆续有读者询问是否有对应的中文版本。
为此,我们于 2023 年 8 月发布了该综述(v10)的中文翻译版。在2023 年 12 月底,为了更好地提供大模型技术的中文参考资料,我们启动了中文书的编写工作,并且于近日完成初稿。与英文综述文章的定位不同,中文版书籍更注重为大模型技术的入门读者提供讲解,为此我们在内容上进行了大幅度的更新 与重组,力图展现一个整体的大模型技术框架和路线图。
本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用, 可以作为一本入门级的技术书籍。
在准备中文书的过程中,我们广泛阅读了现有的经典论文、相关代码和教材,从中提炼出核心概念、主流算法与模型,并进行了系统性的组织与介绍。我们对于每个章节的内容初稿都进行了多次修正,力求表达的清晰性与准确性。
总之,大模型技术正处于快速发展阶段,基础原理亟待探索、关键技术亟待改善。对于科研人员而言,大模型研究工作充满了想象空间,令人为之神往。随着技术的不断进步与共享开放,我们有理由相信,未来人工智能技术将取得更大 的进展,将在更多领域带来更为深远的影响。