论文阅读-文本匹配(三)MatchPyramid(构造匹配矩阵)

版权声明:本文为博主原创文章,未经博主允许不得转载。禁止抄袭。

由于作者资历尚浅,有理解错误的地方欢迎大家指正和交流。


论文简介

论文题目: Text Matching as Image Recognition

论文地址:http://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/download/11895/12024

作者:Liang Pang, Shengxian Wan, Xueqi Cheng

作者单位:中科院计算所(网络数据科学与技术重点实验室

出版单位:the Association for the Advance of Artificial Intelligence(AAAI

发表时间:2016.2


模型图



贡献点:

1.受CNN在图像识别中的启发(可以提取到边、角等特征),作者提出先将文本使用相似度计算构造相似度矩阵,然后卷积来提取特征。把文本匹配处理成图像识别。【想法很特别】

2.根据结果显示,在文本方面使用作者提出的方法可以提取n-gramn-term特征。作者给了一个匹配的例子:

T1 : Down the ages noodles and dumplings were famous Chinese food.

T2 : Down the ages dumplings and noodles were popular in China.

PS:Down the ages是历代以来的意思。

模型可以学习到Down the ages(n-gram特征),noodles and dumplings与dumplings and noodles(打乱顺序的n-term特征)、were famous Chinese food和were popular in China(相似语义的n-term特征)。

作者基于此模型,在2017.3-2017.6 Kaggle的Quora Question Pairs 比赛上,取得了全球第四的好成绩。(YesOfCourse 团队)【效果很不错】


实验数据:

1.MSRP数据(判断两个短语是否有相同含义,4k训练,1.7k测试)

2.论文引用匹配(Paper Citation Matching)数据,约84w数据(28w正例,56w负例)。作者自己搜集,没有公开?


细节:

1.Ai和Bj距离度量方式:完全一样 (Indicator),余弦相似度 (Cosine),点乘 (Dot Product)。

2.卷积,RELU激活,动态pooling(pooling size等于内容大小除以kernel大小)。

3.卷积核第一层分别算,第二层求和算。可以见下图3*3的kernel分别算,2*4*4求和算。


4.MLP拟合相似度,两层,使用sigmoid激活,最后使用softmax,交叉熵损失函数。

5. Embedding长度较小的比较没用,用DOTCOS好。


不足:

1.MSRP上效果不如uRAE。(怎样把外部数据加入)





  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值