Learning to Rank Short Text Pairs with Convolutional Deep Neural Networks(阅读理解)

本文重点:

和一般形式的文本处理方式一样,并没有特别大的差异,文章的重点在于提出了一个相似度矩阵


计算过程介绍:

query和document中的首先通过word embedding处理后获得对应的表示矩阵

利用CNN网络进行处理获得各自的feature map,接着pooling后获得query对应的向量表示Xq和document的向量Xd

不同于传统的Siamense网络在这一步利用欧式距离或余弦距离直接对Xq和Xd进行相似性计算后预测结果,网络采用一个相似矩阵来计算Xq和Xd的相似度,然后将Xd,Xq和sim(Xq,Xd)进行连接,并添加了word overlap和IDF word overlap的特征后作为特征向量输入一个神经网络层

神经网络层的输出经过一个全连接层,利用softmax函数得出预测结果

阅读更多
文章标签: CNN Text Rank
个人分类: 文本相似度
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭