Convolutional Neural Network Architectures for Matching Natural Language Sentences(阅读理解)


以上图片是作者提供的一个最基本的并且通用的文本分类模型,文章后面介绍的内容是以此结构进行展开的

作者提出卷积神经网络模型来匹配两个句子,该模型不仅能够很好地表示句子的层次结构,而且能够逐层构图和合并,而且能够在不同层次捕捉到丰富的匹配模式


作者首先基于上一个模型提出了一个用于比较两个句子相似度的模型,这个模型的缺点在于将两个句子encode成句向量之后再用多层感知机进行分类,这种方法就很明显没有体现出句子之间的交互操作

根据缺少交互这一问题,作者改进了新的模型,将1-D卷积操作通过变换修改成和两个句子的相关的feature map,如下图所示


本文重点

这篇文章的核心点在于Layer-1 (1D convolution)

首先从Sentence x中任取一个向量xa,再从Sentence y中将每一个向量和xa进行卷积操作

同理以上操作,将两个句子中所有的向量两两组合,构成2D向量

后续的操作和一般的卷积操作没有太多区别

阅读更多
文章标签: CNN Text
个人分类: 文本相似度
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭