余弦相似度机器学习_深度学习语义相似度系列：Ranking Similarity

最新推荐文章于 2024-07-30 01:18:47 发布

黑猫Q形态

最新推荐文章于 2024-07-30 01:18:47 发布

阅读量900

点赞数

文章标签：余弦相似度机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28938385/article/details/112750438

版权

本文介绍了深度学习语义相似度的建模方法，包括回归、分类和排序相似性学习。重点讨论了排序相似性模型，如DSSM，并提出在缺乏监督数据时，利用无监督的余弦相似度和偏序关系来构建训练数据。此外，还探讨了损失函数的选择，如间隔softmax损失函数，用于优化模型的相似度度量能力。

摘要由CSDN通过智能技术生成

我们在基于深度学习的语义相似度模型系列文章的开篇《深度学习语义相似度系列：概论》中介绍了两种语义相似度的学习范式，其中第一种范式的重点是表示学习，也就是为输入对象学习一个低维稠密的embedding向量，使得基于此embedding向量计算的相似度能够很好地反映原始对象之间的相似性。本文主要介绍一种在第一范式下的相似度学习模型的设计。

相似度度量建模

一般而言，相似度度量可以建模为回归问题，也可以建模为分类问题，甚至可以建模为排序问题。取决于我们有什么格式的标签数据。

回归相似性学习

给定一对输入

以及它们的相似性度量值

. 回归相似性学习的目标是在三元组

训练数据集上学习一个近似函数

。这通常通过最小化一个带正则项的损失函数来达成目标

。

分类相似性学习

假设我们拥有的训练数据为一组成对的相似对象

集合和不相似对象

集合，训练数据可以等价地描述为对于每一个成对的输入对象

，关联一个二值标签

，标签表示输入的两个对象是否相似。分类相似性学习的目标是学习一个分类器来预测相似度。

排序相似性学习

相似度度量建模为回归或者分类问题虽然简单，但很多时候我们没有合适的带有标签的监督数据可用，而且人工标注的代价又很高。这时我们可以考虑把相似性度量问题建模为排序问题。

具体地，假设我们有一个由三元组

构成的数据集，其中每个三元组代表了一个预先定义好的偏序关系：

与

的相似度大于于

的相似度。排序相似性学习的目标是学习一个相似性度量函数

，使得对于一个新的三元组有

成立。 </

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。