CNN在句子相似性建模的应用--模型介绍篇

本文深入探讨了使用CNN进行句子相似性建模的论文,通过两种卷积方式和三种池化方法提取句子特征。文章介绍了模型架构,包括句子表示层、相似性计算层和全连接层,并详细阐述了卷积核、池化层的设计及其工作原理。最后,文章提及了相似性计算的算法和全连接层的使用,为后续的tensorflow实现奠定了基础。
摘要由CSDN通过智能技术生成

最近在读“Multi-Perspective Sentence Similarity Modeling with Convolution Neural Networks”这篇论文,该文通过CNN层对两个句子分别进行建模,然后添加一个句子相似性测量层来计算两个句子的相似度。首先可以看一下其模型的架构图方便有一个直观的理解:
这里写图片描述
可以看到一个句子首先被转化为嵌入矩阵[sentence_length, embed_size],然后输入卷积-池化层(这里论文中提出使用两种卷积方式+三中池化方式,如图所思)得到处理后的句子向量。为了计算两个句子之间的相似度,论文中提出了两种算法,分别应用于不同卷积层的输出结果计算其相似性。最终将得到的相似性向量输入全连接层得到相似性分数,与标签相比较。从而进行训练等。接下来就详细的看一下每一部分内容。

句子表示层

本文之所以成为Multi-Perspective的句子相似性建模就是因为其提出了两种卷积核+三种池化方法,从而可以从不同层面提取出句子的特征。如下图所示:

  • 6
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值