书籍-《基于Python的自然语言处理(第三版)》_文本处理

编辑:陈萍萍的公主@一点人工一点智能

书籍:Python for Natural Language Processing: Programming with NumPy, scikit-learn, Keras, and PyTorch,3rd

作者:Pierre M. Nugues

出版:Springer

01 书籍介绍

自本书上一版(2014年)出版以来,自然语言处理(NLP)各领域取得了惊人的进展,特别是在文本生成方面的最新成就引发了媒体关注,其影响力已超越传统学术界。与此同时,文本处理已成为主流工业工具,被无数公司在不同程度上采用。因此,对本书进行修订以跟上最新突破显得尤为重要。作者在本修订版中探讨了促进NLP近期取得进展的模型和架构。

与前两版一样,本书旨在向读者介绍NLP中使用的理论,并通过编程示例帮助读者深入理解这些概念。尽管机器学习在前两版中已有所体现,但如今它的重要性更加凸显,已取代了许多早期的文本处理技术。许多新技术都建立在文本资源可得性的基础上。

通过使用Python Notbook,读者可以加载小型语料库、格式化文本、通过执行代码片段来应用模型,并可能通过修改代码或参数来逐步发现理论部分。这种用户与机器之间的持续互动,使读者能够穿越理论与实际问题的界限。同时,为了使用户能够在大多数机器上即时或至少快速地看到大多数实验的结果,本书对数据大小和硬件要求保持在了合理的最低限度。

本书不要求读者具备深厚的Python知识,第2章专门介绍了针对文本处理的Python语言入门知识,使读者能够掌握所有编程概念,包括NumPy数组和PyTorch张量(作为Python中表示和处理数值数据的基础结构),以及使用Keras训练神经网络对文本进行分类。教材涵盖了分词、词性标注和序列标注等主题,并深入概述了Transformer(如BERT)、自注意力机制和序列到序列架构等内容。

02 作者简介

Pierre M. Nugues是隆德大学计算机科学系的教授。他的研究重点是高级用户界面和口语对话的自然语言处理。这包括在多模态框架和文本可视化中设计并实现对话代理。他领导团队设计了导航代理“尤利西斯”,使用户能够通过语言在虚拟现实环境中进行导航,还领导团队设计了CarSim系统,该系统可以根据书面文本生成动画3D场景。他曾在以下机构教授自然语言处理和计算语言学:法国卡昂的ISMRA、英国诺丁汉大学、英国斯塔福德郡大学、德国康斯坦茨应用技术大学、瑞典隆德大学和比利时根特大学。

03 书籍大纲

书籍-《基于Python的自然语言处理(第三版)》_Python_02