Online Collective Matrix Factorization Hashing for Large-Scale Cross-Media Retrieval

qq2285580599

已于 2022-03-30 17:04:51 修改

阅读量270

点赞数

分类专栏： Online CMH 文章标签：计算机视觉

于 2021-05-26 22:12:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2285580599/article/details/117296481

版权

Online CMH 专栏收录该内容

7 篇文章

订阅专栏

该博客探讨了现有跨模态哈希方法的局限性，尤其是无法根据新数据更新旧哈希码的问题。为此，提出了OCMFH方法，它能仅用新数据点重训哈希函数并更新旧数据的哈希码。同时，采用动态去中心化策略解决了在线哈希学习中的均值变动问题。文章还介绍了相关工作，包括在线哈希和无监督跨模态检索方法，并详细阐述了OCMFH的优化步骤和收敛性证明。此外，讨论了如何利用新关系更新旧哈希值，以及算法的时间和空间复杂度分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

现有的跨模态哈希方法都是基于batch的方式学习哈希函数。

现有的一些在线跨模态哈希方法可以解决这个问题。

然而，这些方法存在一个很大的问题：

不能根据新到来的数据更新旧的哈希码。

所以我们提出了我们的方法OCMFH，这个方法有两个好处：

1，OCMFH仅通过新到达的数据点重新训练哈希函数。

2，它生成新数据的哈希码，并通过最新更新的哈希模式更新旧数据的哈希码。

同时，我们也提出了一种去中心化策略，来解决在线哈希学习中均值变动的问题。

相关工作

在线哈希方法

基于SGD策略的：OKH OSupH MIHash HCOH

基于Sketch策略的：OSH OSSH FROSH

监督在线跨模态检索方法

OLSH FOMH OMMH

缺点：监督信息是很难获得的，并且手动标注会耗费大量的经历。

无监督在线跨模态检索方法

目前我们所发现的只有两种(2020年了哦)无监督跨模态检索的方法：

OCMH DMVH

缺点：如果要更新旧数据的哈希码就必须重新生成或者要访问那些旧的数据。

效率不高。

离线矩阵分解方式

OCMFH的前置定义

哈希映射

这里的 $b_{m}$ 设置为映射之后值的平均值：

由于我们提前对数据进行了去中心化，所以这里的 $b_{m}$ 可以视为零向量了。

所以映射可以重新写为：

去中心化

为什么要去中心化？

1，原论文中说为了便于学习哈希函数，也就是收敛得更快。

2，其实还有一个用处，在OSH这篇论文中有详细描述：

值得注意的是，零均值归一化步骤将在很大程度上影响哈希算法的性能，也就是会提升精度。

（所以，广泛阅读论文是有用的，因为别的论文中的一个小trick可能就会拯救你的整个实验）。

这里使用的是动态去中心化的策略：

OCMHF的提出与优化

U1-step

U2-step

P1-step

P2-step

$V^{(t)}$ -step

忽略其它无关的变量，损失函数变为以下的形式：

然后求导为0，可以求 $V^{(t)}$ .

收敛性定理与证明

定理：目标函数是有界的。并且在每次迭代中单调地减少目标函数的值。

证明：首先目标函数肯定非负。

其次目标函数被分为5个子问题，这五个子问题，每一个子问题只对一个

变量进行求导的时候是凸的，所以使得每个子问题最小值的U,V等值就是

当前最优的。所以每次迭代目标函数的值都是降低的。

旧的哈希值的更新

重点就是找到一个合适的等式关系！！！

这里找到的就是

$U_{1}^{(t)}$ 就是第t次迭代生成的U，是符合第t次规则的V

$U_{1}^{(t-1)}$ 就是第t-1次迭代生成的U，是符合第t-1次规则的V.

这样问题就变为下列的损失函数：

求导为0之后得到：

复杂度分析

时间复杂度和空间复杂度都是 $O(n_{t})$ .

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。