Online Fast Adaptive Low-Rank Similarity Learning for Cross-Modal Retrieval

摘要

跨模态数据之间的语义相似性是跨模态检索中的一个瓶颈问题。

现有的基于batch的训练方法有着令人望而生畏的时间复杂度和空间复杂度。

所以我们为跨模态检索提出了低秩双线性相似度度量。

它的原理是:我们通过三联体损失,建立了相对的相似度关系,从而建立了跨模态模型。

它的好处是:

1,通过在hinge loss中设置margin,这种margin是基于标签空间和特征空间的两两相似度。

CMOLRS有效地捕捉了多层的语义关联,并且适应了跨模态数据的语义差异。

2,通过设置低秩限制,相似度函数就能在低秩流形空间进行在线方式学习。

低秩空间使得模型学习过程具有更快的速度和更好的可扩展性,而且提高了模型的通用性。

3,我们提出来fast-CMOLRS,对每一个query施加了多个三联体损失,而不只是一个。

好处是减少了梯度更新的时间和回撤的次数,提高了训练的速度。

与常规方法比较

现有的常规方法,是比较在公共空间内的距离来断定数据的相似度。

然而这种方法不是直接对数据进行排序比较,所以,

1,我们提出了直接进行排序比较的方法。

2,我们的相似度函数是通过三联体集合中的相对相似性来度量的。

并且我们的margin是可以进行自适应调节的,通过特征空间和标签空间。

3,我们采用了在线学习策略,规避了大的计算量负担。

4,我们添加了低秩约束,处理了大量高维数据,有利于降低过拟合风险,

低秩已经被广泛应用于度量和相似度学习当中了。

提出方法

我们分别构建了图像到文本和文本到图像检索的两种模型。这里我们只看一个,就是文本到图像。

我们的算法分为三步:从text query中采用一个或者几个三联体损失,计算适应性的margin,通过

计算梯度来计算W.

  • 适应性的相对的相似度

相似度可以表示为这一种形式:

                                          

对于检索任务,检索文档的相对顺序比检索文档与查询的绝对相似性更重要。

                                

                       

  

                          

注意,这里的标签向量是已经进行了l2正则化的。margin也变成可调节的。

可调节的好处就是对于相似和正例和负例,我们给予较小的margin,

对于不相似的正例和负例,我们给予较大的margin.这样,相似的正例和负例就可以忽略,

不相似的就会严格比较,大大提高了训练的速度。

  • 低秩流形空间的在线学习

总体的损失函数可以定义为:

      

两种解决低秩的方法:重复奇异值分解,优化低秩矩阵的因式表示。要不计算复杂度高,

要么数值不稳定。于是我们采用了LORETA.

我们把W分解为两个较小矩阵A和B相乘。W = A*B.

并且我们计算A和B的伪逆的过程也是rank-1时间复杂度的。

  

  • 采样策略

​​​​​​​我们可以为一个text query采样一个三联体损失,这就是CMOLRS.

也可以为一个text query采样多个三联体损失,这就是fast-CMOLRS.

采用fast的方式需要找的text query就越少,这样梯度下降的次数就越少,训练的速度就越快,虽然每

一个text query的triplet数增多。

算法框架

​​​​​​​

​​​​​​​

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在3D表面重建中,适应性条纹投影用于避免图像饱和。饱和是指当投影的光线过亮时,图像中的某些区域会出现过曝或过暗的现象。为了解决这个问题,适应性条纹投影技术被引入。 适应性条纹投影技术根据场景的亮度情况调整投影光线的亮度,并在图像中生成相应的条纹纹理。这些条纹纹理具有不同的亮度和颜色,可以在图像中创建一个光照变化的效应。通过这种方式,适应性条纹投影技术可以在不同亮度的区域中保持图像的细节和清晰度,避免了图像饱和现象的发生。 在3D表面重建中,适应性条纹投影技术非常有用。当使用投影仪投影条纹图案到三维表面上进行重建时,不同区域的亮度可能有所不同。一些区域可能非常亮,而另一些区域可能非常暗。如果不处理好这些亮度差异,就会出现图像饱和现象,导致重建结果不准确。 适应性条纹投影技术通过实时调整投影光线的亮度,使得不同区域的亮度更加均衡。这样,被投影区域的光照变化就可以更好地还原,从而获得更准确的三维表面重建结果。同时,适应性条纹投影技术还可以根据场景的亮度变化自动调整投影光线的亮度,提高了系统的稳定性和适应性。 总之,适应性条纹投影技术是一种用于避免图像饱和的重要技术。在3D表面重建中,它通过实时调整投影光线的亮度,保持图像区域亮度的均衡,从而获得更准确的重建结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值