Learning Cross-Modal Retrieval with Noisy Labels

qq2285580599

已于 2022-03-12 16:53:15 修改

阅读量412

点赞数 1

分类专栏： noisy_label 文章标签：聚类机器学习深度学习

于 2021-08-09 11:39:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq2285580599/article/details/119533056

版权

noisy_label 专栏收录该内容

2 篇文章 1 订阅

订阅专栏

摘要

有噪音标签的数据集应该如何处理？我们提出了MRL方法，这包含两个模块：

RC模块是用来使得深度学习网络专注于clean data而并非noise data.

MC模块是使用对比学习，最大化不同模态数据之间的互信息。

这可以分别用来化解噪音的影响和交叉模态的干扰。

提出方法

1，不同模态的数据映射到同一空间

其中i是模态，j是样本的例子。

2，鲁棒性聚类分配

我们首先找出K个聚类点，把它们的集合定义为：

某个样本 $x_{j}^{i}$ 属于第k个聚类点的概率是：

其实这个可以类比于softmax：

意义是一样的，只是变量不一样而已。

然后我们就可以使用cross-entropy来使得正确分类的那个概率最大：

它的曲线如蓝色的曲线所示：

可以观察到一个现象，就是CE倾向于优化hard-samples，（个人觉得）因为hard samples主宰了梯度（hard samples对应的斜率最大）。

CE对于clean-data是好用的，但是对于noisy-data反而更容易过拟合，造成效果不好。

所以在这里我们提出了一种新的损失RC，使得easy-samples主宰梯度，实际上easy-samples在这里就是clean-data.

这实际上就是倾向于优化负样本的log-likelihood.（不用乘以那个真正的0-1的q，减去正的就是默认乘了）。

它的效果就是好学的样本，也就是clean-data主宰了梯度，达到了去除噪音的效果。

3，多模态对比学习

这里我们通过pair的参照进行对比学习：

这个公式的意义是，第j个样本和所有模态的pair的样本做内积，与这个第j个样本与所有模态的所有样本做内积然后相加取比值。

这个比值应该最大，所以我们可以最大化以下的公式：

转化为最小化以下的公式：

这样通过pair和instance的监督方式（这个模块不涉及到noise标签），我们就利用上了对比学习。

4.两个模块的损失整合

然后将这两部分的损失整合起来：

5，图示

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。