大模型技术不仅刷新了自然语言处理的传统知识体系,也推动了新一代人工智能技术的发展。正是在此背景下,赵宇教授撰写了《自然语言处理:大模型理论与实践》(预览版),旨在为学术界和工业界提供一本系统性、前瞻性和实践性兼备的权威著作,帮助读者全面掌握自然语言处理的核心理论和前沿应用。
本书主要面向高校本科生、研究生及教学科研人员,适合作为教学用书。同时,它也适合计算语言学家、语言学家、数据科学家和NLP开发人员等专业人士使用。为了照顾不同读者的学科背景差异,书中附录部分专门介绍了与NLP密切相关的基础知识,如概率论、信息论、机器学习与强化学习等。
《自然语言处理:大模型理论与实践》(预览版)一书以自然语言处理中语言模型为主线,涵盖了从基础理论到高级应用的全方位内容,逐步引导读者从基础的自然语言处理技术走向大模型的深度学习与实际应用。
以下是本书的目录:
序 言 3
前 言 5
主要符号表 9
绪论 21
第一部分 语言模型基础 65
- 词向量 67
- 统计语言模型 81
- 神经语言模型 91
- 概述 91
- 神经概率语言模型 91
- 预训练语言模型 105
第二部分 大模型理论 137
- 大语言模型架构 139
- 多模态大模型架构 157
- 大模型预训练 177
- 大模型微调 195
- 提示工程 223
- 涌现 249
- 大模型评估 277
- 探讨 303
第三部分 大模型实践 329
- 大模型本地开发 331
- 基于大模型的应用开发 343
- 预备知识 383
- 缩略语表 421
- 翻译对照表 425
- 相关学术会议与学术组织 429
- 索 引 430
- 参考文献 430