独家 | Python利用深度学习进行文本摘要的综合指南（附教程）

最新推荐文章于 2024-06-30 19:34:18 发布

数据派THU

最新推荐文章于 2024-06-30 19:34:18 发布

阅读量5.8k

点赞数 10

本文链接：https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/96054787

版权

本文详述如何利用Python和深度学习构建文本摘要器，重点介绍序列到序列（Seq2Seq）模型和注意力机制。通过Keras实现了一个完整的文本摘要模型，包括编码器-解码器架构、注意力层的实现和推理过程。文章还探讨了模型的局限性和提升性能的方法，提供了完整的代码示例。

摘要由CSDN通过智能技术生成

作者：ARAVIND PAI

翻译：和中华

校对：申利彬

本文约7500字，建议阅读15分钟。

本文介绍了如何利用seq2seq来建立一个文本摘要模型，以及其中的注意力机制。并利用Keras搭建编写了一个完整的模型代码。

介绍

“我不想要完整的报告，只需给我一个结果摘要”。我发现自己经常处于这种状况——无论是在大学还是在职场中。我们准备了一份综合全面的报告，但教师/主管却仅仅有时间阅读摘要。

听起来很熟悉？好吧，我决定对此采取一些措施。手动将报告转换为摘要太耗费时间了，对吧？那我可以依靠自然语言处理（NLP）技术来帮忙吗？

自然语言处理（NLP）

https://courses.analyticsvidhya.com/courses/natural-language-processing-nlp?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python

这就是使用深度学习的文本摘要真正帮助我的地方。它解决了以前一直困扰着我的问题——现在我们的模型可以理解整个文本的上下文。对于所有需要把文档快速摘要的人来说，这个梦想已成现实！

640?wx_fmt=png

我们使用深度学习完成的文本摘要结果如何呢？非常出色。因此，在本文中，我们将逐步介绍使用深度学习构建文本摘要器的过程，其中包含构建它所需的全部概念。然后将用Python实现我们的第一个文本摘要模型！

注意：本文要求对一些深度学习概念有基本的了解。我建议阅读以下文章。

A Must-Read Introduction to Sequence Modelling (with use cases)

https://www.analyticsvidhya.com/blog/2018/04/sequence-modelling-an-introduction-with-practical-use-cases/?

utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python

Must-Read Tutorial to Learn Sequence Modeling (deeplearning.ai Course #5)

https://www.analyticsvidhya.com/blog/2019/01/sequence-models-deeplearning/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python

Essentials of Deep Learning: Introduction to Long Short Term Memory

https://www.analyticsvidhya.com/blog/2017/12/fundamentals-of-deep-learning-introduction-to-lstm/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python

1. NLP中的文本摘要是什么？

在了解它是如何工作之前，我们先来看看文本摘要是什么。如下是一个简洁的定义，我们开始吧：

“自动文本摘要的任务是生成简明扼要的摘要，同时保留关键信息内容和整体含义”

- 文本摘要技术：简要调查，

2017

大致有两种不同的方法用于文本摘要：

抽取式摘要（Extractive Summarization）
生成式摘要（Abstractive Summarization）

640?wx_fmt=png

让我们更详细地看一下这两种类型。

抽取式摘要

这个名字透露了这种方法的作用。我们从原文中找出重要的句子或短语，并从中抽取。这些抽取出的句子将成为我们的总结。下图简要说明了抽取式摘要：

640?wx_fmt=png

我建议你通读这篇文章，它介绍了如何使用TextRank算法构建一个抽取式文本摘要器：

An Introduction to Text Summarization using the TextRank Algorithm (with Python implementation)

https://www.analyticsvidhya.com/blog/2018/11/introduction-text-summarization-textrank-python/

生成式摘要

这是一个非常有趣的方法。当中，我们会从原文中生成新的句子。这与我们之前看到的抽取方法形成了对比，之前我们只使用了现存的句子。通过生城式摘要生成的句子可能并未出现在原文中：

640?wx_fmt=png

你可能已经猜到了——我们将在本文中使用深度学习构建一个生成式文本摘要器！在深入实现这部分之前，我们先了解一些构建文本摘要生成模型所需的概念。

前方高能！

2. 序列到序列（Seq2Seq）建模简介

我们可以针对涉及顺序信息的任何问题构建Seq2Seq模型。顺序信息的一些非常常见的应用包括情感分类，神经网络机器翻译和命名实体识别。

在神经网络机器翻译的情况下，输入是某一种语言的文本，输出是另一种语言的文本：

640?wx_fmt=png

在命名实体识别中，输入是一个单词序列，而输出是输入序列中每个单词的标记序列：

640?wx_fmt=png

我们的目标是构建一个文本摘要生成器，其中输入是一个单词的长序列（文本正文），输出是一个简短的摘要（也是一个序列）。因此，我们可以将其建模为多对多Seq2Seq问题。 以下是一个典型的Seq2Seq模型架构：

640?wx_fmt=png

Seq2Seq模型有两个主要组件：

编码器
解码器

我们来详细了解一下这两个组件。这些对于理解文本摘要是如何工作的代码至关重要。你还可以查看本教程以更详细地了解序列到序列建模。

教程：

https://www.analyticsvidhya.com/blog/2018/03/essentials-of-deep-learning-sequence-to-sequence-modelling-with-attention-part-i/?utm_source=blog&utm_medium=comprehensive-guide-text-summarization-using-deep-learning-python