Data-to-Text文献学习·《Learning to Select, Track, and Generate for Data-to-Text》

JJ'll_be_fantastic

于 2022-08-24 21:49:55 发布

阅读量647

点赞数

文章标签：学习 nlp

本文链接：https://blog.csdn.net/weixin_43886357/article/details/126500635

版权

一、总述

数据到文本生成是NLG的一项任务，用于从结构化或非结构化数据生成描述，包括体育评论、天气预报、来自维基百科信息框的传记文本以及来自股票价格的市场评论。运用神经网络来处理这一任务已经成为主流，且结合attention和copy机制的encoder-decoder架构已被成功使用，并获得较好的结果。然而，尽管生成的文本流畅度增高了，但是生成文本与输入的关联性并不太高，即存在描述不一致的问题。

Puduppully曾在《Data-to-Text Generation with Content Selection and Planning》一文中提出NCP模型，NCP模型和这篇文章提出的模型的相似点是，都在序列层面上考虑了内容计划。本文与NCP不同的是，本文使用RNN来显式跟踪，而NCP使用的是LSTM；并且本文在解码器阶段在不固定数据记录序列的情况下动态选择要提及的数据记录，而NCP的数据集是固定的，且并非动态选择。

二、相关工作

2.1记忆模块（ Memory modules，这个概念之前没有接触过，后续还要看看文献）

该模块常应用于NLU，以跟踪实体状态，本文的模型将数据的实体跟踪模块扩展到文本生成任务。实体跟踪模块在每个时间步长中选择显著实体和适当属性，更新其状态，并从所选数据记录中生成一致的摘要.

三、模型

本文模型的核心是一个具有记忆状态 $h^{LM}$ 和 $h^{ENT}$ 的神经网络语言模型，其中 $h^{ENT}$

有两个作用：一是用来去记住那些已经被参考了的数据记录，二是去更新 $h^{LM}$ ，这意味着被参考的数据记录将对文本生成阶段产生影响。

本文模型可以决定是否参考数据记录集 $x$ ，选择哪些记录 $r\in x$ 被提及，并且如何去表达数字。被选择的数据记录将用于 $h^{ENT}$ 的更新。

为方便论文展示，此处先作变量声明：

（1） $Z_t$ 是一个二元变量，用于决定模型是否在t时刻参考了x；

（2） $E_t$ 表示了在t时刻的显著实体；

（3） $A_t$ 表示t时刻的显著属性（NCP里的type）;

（4） $N_t$ 用于判定数值型数据用何种方式表达（阿拉伯数字还是英文）

为了保持对显著实体的追踪，在摘要生成阶段，本文模型在每一个时刻都要预测上述随机变量。由于空间局限性，模型省略了偏置变量。

符号声明：

$\varepsilon$ ：实体集

$A$ ：类型集

3.1初始化

3.2显著对象的转换

这里的显著对象包含着实体和其类型，本文用如下概率去决定在t时刻是否进行转换

若该概率值很高，那么就转换对象。在进行转换时，模型需要去决策转换到哪个实体和类型上，并生成下一个词汇，并同时更新 $h^{ENT}$ ，继而更新 $h^{LM}$ 。若不进行转换，那么t时刻和t-1时刻的 $h^{ENT}$ 相同

3.3对象选择和追踪

当模型决定参考一个新的数据记录时（此时 $Z_t=1$ ），将会选一个实体和一个类型。与此同时，它还通过将有关选定实体和属性的信息放入记忆向量 $h^{ENT}$ 来跟踪显著性实体，模型开始选择主题实体，并在主题实体发生变化时更新记忆状态。模型通过以下公式来进行实体选择：

其中， $\varepsilon_{t-1}$ 表示在t时刻时，以及被提及的实体所组成的集合，其中s指上一次提起该实体的时刻。当实体被变换时，模型将用以下式子进行计算：

并用如下公式进行类型的选择：

此时 $h^{ENT}$ 将会进一步更新，用如下式子计算：

也就是说，进行一次transition，由于要转换实体和类型，故需要分两步更新 $h^{ENT}$ 。

3.4摘要生成

有了两个hidden state， $h_{t-1}^{LM}$ 用作语言模型， $h_t^{ENT}$ 用作追踪模型，基于此，模型生成t时刻的单词

$y_t$ 。同时，本文模型也引入了copy机制，可从 $x[e_t,a_t]$ 中复制词汇。对于数值型数据，由于有两种表达方式，即阿拉伯数字型和英文单词型，需用以下公式来决定用哪一种形式：

当模型决定用新的数据记录时（ $Z_t=1$ ），将通过以下公式更新语言模型的hidden state:

此时，输出的单词 $Y_t$ 由以下公式计算：

此时 $h^{LM}$ 将会由以下公式更新：

其中 $y_t$ 是 $Y_t$ 向量。

3.5学习目标

最大化以下式子：

JJ'll_be_fantastic

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Data-to-Text文献学习·《Learning to Select, Track, and Generate for Data-to-Text》

并且本文在解码器阶段在不固定数据记录序列的情况下动态选择要提及的数据记录，而NCP的数据集是固定的，且并非动态选择。然而，尽管生成的文本流畅度增高了，但是生成文本与输入的关联性并不太高，即存在描述不一致的问题。该模块常应用于NLU，以跟踪实体状态，本文的模型将数据的实体跟踪模块扩展到文本生成任务。表示在t时刻时，以及被提及的实体所组成的集合，其中s指上一次提起该实体的时刻。在进行转换时，模型需要去决策转换到哪个实体和类型上，并生成下一个词汇，并同时更新。用作追踪模型，基于此，模型生成t时刻的单词。
复制链接

扫一扫