Comprehensive Distance-Preserving Autoencoders for Cross-Modal Retrieval

qq2285580599

已于 2022-03-12 16:55:15 修改

阅读量158

点赞数

分类专栏： unsurpervised 文章标签：计算机视觉

于 2021-08-23 22:14:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2285580599/article/details/119878535

版权

unsurpervised 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

摘要

这是无监督跨模态的一个早期的工作，之前的无监督方法主要考虑拉近属于同一对象的两两关系。而我们的方法不仅考虑了pairwise关系，也考虑了同模态和不同模态的距离。

我们的方法主要包括四个部分：

1，去噪自编码器。取出SIFT提取特征中的噪声。

2，全面的保持距离的公共空间。学习公共空间，使得模态内和模态间的信息在这个公共空间得到保持。

3，共同的损失函数。去噪损失函数+pair的损失+不pair的与原空间对比的损失。

4，一种无监督的跨模态相似度度量方式。

提出方法

去噪自编码器

满足，

后面的时候，用的是简化的F.

综合保持距离的公共空间

1 - 余弦相似度表示距离：

pair的相似度：

不pair的模间相似度：

满足，

不pair的模内相似度：

联合损失函数

无监督度量方式

分别代表 v 和 t 的 k 个最近邻点。

P在这里代表相似度。

（这里区别DGCPN，DGCPN里面把v和t糅合成一个节点，然后取k近邻，这里是分别对v和t取k近邻。）

图示

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Comprehensive Distance-Preserving Autoencoders for Cross-Modal Retrieval

摘要这是无监督跨模态的一个早期的工作，之前的无监督方法主要考虑拉近属于同一对象的两两关系。而我们的方法不仅考虑了pairwise关系，也考虑了同模态和不同模态的距离。我们的方法主要包括四个部分：1，去噪自编码器。取出SIFT提取特征中的噪声。2，全面的保持距离的公共空间。学习公共空间，使得模态内和模态间的信息在这个公共空间得到保持。3，共同的损失函数。去噪损失函数+pair的损失+不pair的与原空间对比的损失。4，一种无监督的跨模态相似度度量方式。提出方法去噪自编码器
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。