文本相似(STS)计算在搜索排序、对话等场景中都有很广泛的应用,在此就几种深度学习中文本相似计算方法展开讨论。本篇介绍Siamese Net这个经典结构的理论与实践。
论文题目:《Learning Text Similarity with Siamese Recurrent Networks》
论文链接:https://www.aclweb.org/anthology/W16-1617.pdf
Siamese Net
孪生网络指有着两个相同结构的网络模型,早在2005年就被提出,当时是用在了图像相似匹配任务中,它构建了两个相似的网络结构分别来表征两张图片,然后通过距离计算方式来度量两个数据之间的相似度。类似在CV中的使用方式,该方法近些年来在NLP的文本相似计算中被大量使用。这里就拿16年ACL上面比较经典的一篇论文来进行学习与实现。