一、对于doc的表示方法
- 方法一:
最常见的一种方法是将一篇文章看成一个有序的单词流序列,如下模型所示,图中的每个圆圈代表某个单词的神经网络语义表达,图中的BiRNN代表双向RNN模型。
在这个序列上使用RNN来对文章进行建模表达,每个单词对应RNN序列中的每个时间步的输入,RNN的隐层状态代表融合了本身单词以及其上下文语义的语言编码。
这种表示方法的特点就是,它不对文章的整体语义进行编码,而是对每个单词及其上下文语义进行编码,在实际的使用过程中是使用每个单词的RNN隐层状态来进行相关计算。
方法一往往在机器阅读理解系统的原始输入部分对文章进行表示,因为对于很对阅读理解任务来说,本质上是从文章中推导出某个概率最大的单词作为问题的答案,所以文章以单词的形式来表征非常自然。 - 方法二:
另一种常见的文章内容表达方式则是从每个单词的语义表达推导出文章整体的Doc Embedding表达,这种形式往往是在对问题和文章进行推理的内部过程中使用的表达方式。表达过程如下:
图中模型的具体表示含义是,类似于上一个图,先用双向RNN来对每个单词及其上下文进行语义表征,形成隐层状态表示,然后对于向量的每一维数值