【最优传输论文七】2020CVPR - Enhanced Transport Distance for Unsupervised Domain Adaptation

最新推荐文章于 2023-08-03 17:12:42 发布

羊驼不驼a

最新推荐文章于 2023-08-03 17:12:42 发布

阅读量301

点赞数

分类专栏：最优传输文章标签：算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60231311/article/details/130654493

版权

本文针对无监督域适应（UDA）的问题，提出了一种增强的传输距离（ETD），通过注意力机制改进OT距离，以解决小批量训练和忽视类别信息的挑战。ETD利用Kantorovich势网络重新参数化，结合熵正则化，以端到端的方式优化模型，提升uda性能。

摘要由CSDN通过智能技术生成

摘要

从分布匹配的角度出发，将最优传输模型应用于UDA。然而，传输距离不能反映领域知识或类别先验的判别信息。在这项工作中，文中提出了一个增强的UDA传输距离(ETD)。该方法建立了一个注意力感知的传输距离，该传输距离可以看作是迭代学习分类器的预测反馈，用于测量域差异。在此基础上，利用深度神经网络对Kantorovich potential变量进行参数化，学习其在潜在空间中的分布。为了探索目标域的内在结构，提出了基于熵的正则化方法。提出的方法以端到端交替优化。在四个基准数据集上进行了大量的实验，以证明ETD的SOTA性能。

介绍

现有的基于OT距离的域自适应方法主要受到两个瓶颈的制约。

（1）首先，基于传输距离的深度自适应方法是基于欧几里得度量和小批量训练方式的。由于小批量内的采样实例不能完全反映真实分布，因此得到的运输距离缺乏判别性，估计的运输计划有偏差。

（2）其次，一些OT方法忽略了目标域的标签信息和潜在结构

为了解决上述瓶颈问题，本文提出了一种增强传输距离(ETD)模型来解决UDA中的分类问题。模型的基本结构由特征提取网络、分类网络和运输计划优化三部分组成。第三部分特别强调了我们的新颖性。本文的主要贡献总结如下:

为了充分利用分类网络基于类别的输出，利用注意机制来估计样本之间的相似性，并用注意分数来衡量传输距离cost函数。期望加权距离能够很好地学习判别特征。区别于Curty的类正则
采用三层全连通网络对Kantorovich potential进行重新参数化，取代了传统半对偶优化问题中的矢量对偶变量（即对偶变量用向量表示）
利用目标域上的熵准则来探索目标分布的内在结构。提高了学习到的分类器的可移植性。整个模型以端到端的方式进行训练。

OT简要回顾

OT距离最初被公式化为Monge问题。考虑分别从空间X和Z采样的两个随机变量X～µ和Z～v，以及损失函数

OT的目标是找到两个度量空间之间的映射，使得两个概率测度之间的传输成本最小。

Kantorovich通过将Monge问题转化为耦合（X，Z）～π的最小化，而不是映射集，从而放松了Monge问题，

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【最优传输论文七】2020CVPR - Enhanced Transport Distance for Unsupervised Domain Adaptation

然后将注意力矩阵S归一化为单位长度，即矩阵S的每一行元素和为1，例如，通过softmax，其中bt是目标域的小批量大小。Kantorovich通过将Monge问题转化为耦合（X，Z）～π的最小化，而不是映射集，从而放松了Monge问题，其中π的边缘应等于µ和v。这种方法扩展了对偶变量的适用性，使得最优传输计划学习过程可以摆脱当前特征空间的约束，在更灵活的空间中进行。由于潜在变量重新参数化网络g的更新是整个模型优化之外的一个独立循环，因此相应的参数表示为W g，其他部分的参数则表示为W。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。