Online latent semantic hashing for cross-media retrieval

qq2285580599

已于 2022-03-30 17:05:18 修改

阅读量183

点赞数

分类专栏： Online CMH

于 2021-05-25 22:32:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2285580599/article/details/117230508

版权

python 计算机视觉

Online CMH 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

摘要

数据经常以流的方式传输，这使得现今的现有的基于batch的方案失去了效率。

所有我们提出了OLSH.

这种方式有两个好处：1，只要新到来的数据参与了哈希函数的学习。

2，同时这也保持了旧数据点的语义关联。

特别的是：为了学习更精确的哈希码，离散的标签映射到连续空间，在这里数据点之间

的语义相关信息可以被正确地度量。

然后我们提出了OLSH的优化方式，每一轮的时间复杂度只和新到来的数据有关。

关于OLSH的贡献

OLSH使用一种在线的方式学习哈希函数。
OLSH探索了一种连续的潜在语义空间，在这个语义空间相似度可以被准确地度量。

提出OLSH

提出连续潜在语义空间

为了高效，我们提出了直接把哈希码映射到标签空间。但是由于标签的离散性，直接为

不同类的语义建模是困难的。因此，我们首先把离散的标签映射到一个连续的潜在语义

空间内，在这个空间内各个点的语义距离可以度量地更准确。

独立地学习哈希函数

然后我们独立地学习哈希函数，哈希函数的学习错误定义为：

整体的目标函数

优化过程

B-step

我们只考虑第t批哈希化的数据 $B^{(t))}$ ，这样我们就能够得到式子：

然后我们把它展开：

这种形式的话，就直接使用Appendix1的方法求得第t批次的数据 $B^{(t))}$ .

然后和之前的数据合并起来形成哈希码数据集B.

C-step

我们只考虑映射C.这样我们就能得到下列的式子：

然后我们就可以通过求导梯度为0的方式得到C：

其中，

所以训练C的时间复杂度只和新到达的数据规模 $N^{(t)}$ 有关。

U-step

同理，关于U的式子可以定义为：

可以通过求导梯度为0的方式得到U：

同上，训练的时间复杂度只和新到达的数据规模 $N^{(t)}$ 有关。

W-step

关于W1的式子可以定义为：

同理，我们也可以得到求W2的式子：

同上，训练的时间复杂度只和新到达的数据规模 $N^{(t)}$ 有关。

为了降低计算的时间复杂度

其中，计算的时间复杂度是

特征空间的维度是很高的，所以直接乘计算起来就很耗费时间。

由于α只带来微不足道的修改，

这里我们可以直接采用Sherman-Morrison-Woodbury公式：

在这个式子里，

整体的算法

Appendix1

让我们来考虑这种格式下，离散地计算哈希码：

其中，

计算方法如下，其实就是纯手算，一列一列地计算哈希码，计算某一列的时候使用除这一列

之外的其他所有列：

$z^{(T)}$ 是B的某一行，B'是之外的。

$q^{(T)}$ 是Q的某一行，Q'是之外的。

$v^{(T)}$ 是W的某一行，W'是之外的。

..........................(1)

其中，

...........................................(2)

将(1)和(2)带入到总的式子里，得到

这样就可以计算出当前列的哈希码为

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Online latent semantic hashing for cross-media retrieval

摘要数据经常以流的方式传输，这使得现今的现有的基于batch的方案失去了效率。所有我们提出了OLSH.这种方式有两个好处：1，只要新到来的数据参与了哈希函数的学习。 2，同时这也保持了旧数据点的语义关联。特别的是：为了学习更精确的哈希码，离散的标签映射到连续空间，在这里数据点之间的语义相关信息可以被正确地度量。然后我们提出了OLSH的优化方式，每一轮的时间复杂度只和新到来的数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。