《精通Transformer:从零开始构建最先进的NLP模型》未来引领人工智能世界的是Transformer而非ChatGPT！！

最新推荐文章于 2024-09-27 10:58:53 发布

小涂Ss

最新推荐文章于 2024-09-27 10:58:53 发布

阅读量507

点赞数 14

文章标签：人工智能 transformer 自然语言处理语言模型 ai agi pdf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gaga246/article/details/141424328

版权

前言

在大数据和人工智能时代，机器学习 (Machine Learning,ML) 和深度学习 (DeepLeamning,DL) 已经成为各行各业解决问题的有效方法，自然语言处理 (Natural Language Processing,NLP) 是深度学习的重要应用领域之一。

在过去的二十年中，自然语言处理经历了翻天覆地的变化：从传统的自然语言处理方法 (n-gram 语言模型、基于TF-IDF 的信息检索模型、独热编码文档术语矩阵等)到深度学习方法 (RNN、CNN、FFNN、LSTM 等),再到Transformer。

目前，基于Transformer 的语言模型主导了自然语言处理领域的研究，已经成为一种新的范式。Transformer模型是谷歌公司于2017年推出的自然语言处理经典模型。

在自然语言处理任务中，Transformer 的表现超越了RNN 和 CNN,只需编码器/解码器就能达到很好的效果，并且可以实现高效的并行化。

在这里插入图片描述
本书涵盖了这些自然语言处理方法。基于 Hugging Face社区的Transformer库，我们能够轻松地使用Transformer。

本书将循序渐进地提供各种自然语言处理问题的解决方案：从文档摘要到问题回答系统。我们将看到，基于Transformer, 可以取得最先进的成果。

下载当前版本：完整PDF书籍链接获取，可以V扫描下方二维码免费领取👇👇👇

## 目录 Transformer到底是什么，让ChatGPT如此迷恋？这只变形金刚，到底是只什么怪兽？——用于自然语言处理（NLP）的神经网络架构

第1 章从词袋到Transformer。

本章简要介绍了自然语言处理的历史，并将传统方法、深度学习模型(如CNIN、RNN 和LSTM) 与Transformer模型进行了比较分析。
在这里插入图片描述

第2章 Transformer的实践操作入门。

本章深入探讨了如何使用Transformer模型，并通过实际例子阐述了分词器和模型，如BERT。

在这里插入图片描述

第3章自编码语言模型。

本章讨论了如何从零开始在任何给定语言上训练自编码语言模型。训练过程将包括模型的预训练和特定任务的训练。

在这里插入图片描述

第4章自回归和其他语言模型。

本章讨论了自回归语言模型的理论细节，并引导读者如何在自己的语料库中对模型进行预训练。读者将学习如何在自己的文本上预训练任何语言模型(如GPT- 2),并在各种任务(如语言生成)中使用该模型。
在这里插入图片描述

第5章微调文本分类语言模型。

在本章中，读者将学习如何配置文本分类的预训练模型，以及如何微调文本分类下游任务的模型(如情感分析或多类别分类)。

在这里插入图片描述

第6章微调标记分类语言模型。

本章讲述如何微调标记分类任务的语言模型[如命名实体识别 (NER)、词性标注 (POS)和问题回答 (QA)系统]。

在这里插入图片描述

第7章文本表示。

在本章中，读者将学习文本表示技术以及如何有效地利用Transformer 体系结构，特别是对于无监督任务，如聚类、语义搜索和主题建模。

在这里插入图片描述

第8章使用高效的Transformer。

本章展示了如何使用提炼、剪枝和量化方法，从预训练模型中生成高效的模型。然后，读者将获得有关高效稀疏Transformer的知识，如Linformer 和 BigBird，以及如何使用这些模型。
在这里插入图片描述

第9章跨语言和多语言建模。

在本章中，读者将学习多语言和跨语种语言模型预训练以及单语言和多语言预训练之间的差异。本章涉及的其他主题包括因果语言建模和翻译语言建模。
在这里插入图片描述

第10章部署 Transformer 模型。

本章将详细介绍如何在 CPU/GPU环境中，为基于 Transformer的自然语言处理解决方案提供服务。本章还将描述如何使用 TensorFlow 扩展 (TFX) 部署机器学习系统。

在这里插入图片描述

第11 章注意力可视化与实验跟踪。

本章涵盖两个不同的技术概念：注意力可视化与实验跟踪。我们将使用诸如exBERT 和 BertViz之类的复杂工具进行实验练习。

在这里插入图片描述

下载当前版本：完整PDF书籍链接获取，可以V扫描下方二维码免费领取👇👇👇

关注

14
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。