论文笔记 Domain Adaptation for Semantic Segmentation with Maximum Squares Loss

paper
code

熵最小化原理及缺陷

最小熵原理是需要最小化如下损失函数:
在这里插入图片描述
我们简单起见,只考虑二分类问题,则可以将上式写为:
在这里插入图片描述
p 表示属于类1的概率,则(1- p )表示属于类2的概率。
p 趋近于0或者1时,说明属于类1或者类2的概率较大,如下图所示,此时 H ( p ∣ x t ) H(p|x_{t}) H(pxt)的值也较小,是我们所希望的结果。
在这里插入图片描述
H ( p ∣ x t ) H(p|x_{t}) H(pxt)求梯度得:
在这里插入图片描述
可视化为下图:
在这里插入图片描述
可看出当 p 趋近于0或者1时,属于好学习的样本,此时梯度值非常大;而 p 在0.5周围时,说明是难学习的样本,此时梯度很小,这会造成训练不平衡的问题。

MaxSquareLoss

为了缓解上诉问题,本文提出了MaxSquareLoss,具体为:
在这里插入图片描述
同样的只考虑2分类简单情况,可写成下式:
在这里插入图片描述
对其进行求导,则:
在这里插入图片描述
通过将最小熵和MaxSquareLoss对比可发现,当 p 趋近于0或者1时,梯度值大大降低,从而缓解了训练不平衡的问题。注意下图中的x轴范围是从0.5到1,当 p 取0到0.5时,将其沿x=0.5轴对称过来即可。论文下部分是从f-散度的角度进行解释,感兴趣的话自行阅读。
在这里插入图片描述

Image-wise Class-balanced Weighting Factor(图像级类平衡加权)

在图像分割时,会存在着不同类别样本数量失衡的问题,很显然这会影响训练,但是在UDA任务中,target dataset的标签是未知的,因此不能通过统计各个类别样本的数量然后进行加权,为了缓解该问题,本文统计了每个图像中的各个预测类别的像素个数:
在这里插入图片描述
然后将其倒数作为MaxSquareLoss的加权,得到下式:
在这里插入图片描述
其中 α \alpha α 是超参数。当 N c N^c Nc越小时,说明图像中该类别的像素点越小,该类别分类困难,通过将 N c N^c Nc倒数作为MaxSquareLoss的加权,可以提高训练时对少样本类别的关注度,使训练更加平衡。

  • 27
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 最大分类器差异是一种用于无监督域自适应的方法,它通过最大化源域和目标域之间的分类器差异来提高模型的泛化能力。该方法通过在源域和目标域之间构建一个共享的特征空间,并使用最大均值差异来对齐两个域之间的特征分布。最大分类器差异方法已经在图像分类、目标检测和语音识别等领域得到了广泛的应用。 ### 回答2: 最大分类器差异(maximum classifier discrepancy)是一种用于无监督领域适应的分类器度量方法。在无监督领域适应中,在源域和目标域之间存在着分布差异,因此我们无法直接利用源域的标记样本进行训练。而最大分类器差异方法尝试通过最小化源域和目标域之间的分类性能差异来进行域适应,从而提高在目标域上的分类性能。 在最大分类器差异方法中,我们使用分别使用源域和目标域的数据来训练两个分类器。然后,我们用两个分类器来分别对源域和目标域的数据进行分类,并计算两个分类器之间的差异。这个差异被称为最大分类器差异。最大分类器差异越小,说明源域和目标域之间的分类性能差异越小。 最大分类器差异方法的优点在于它不需要任何标记信息,因此可以更好地解决无监督领域适应问题。此外,最大分类器差异方法可以应用于各种不同类型的数据,包括图像、语音等等。 最大分类器差异方法的一个缺点是,它仅仅关注了源域和目标域之间的分类性能差异,而没有考虑其他因素。另外,最大分类器差异方法的计算复杂度较高,需要对数据进行多次训练和分类,在实际应用中可能存在一定的困难。 ### 回答3: 最大分类器差异(Maximum Classifier Discrepancy,MCD)是一种用于非监督式域适应(Unsupervised Domain Adaptation,UDA)的优化方法,用于在源域和目标域之间的差异中减少域偏移和增加分类器的鲁棒性。MCD在同类和异类样本之间寻找主要差异,并通过对样本特征进行最大投影差异来实现最佳分离。 在非监督式域适应中,我们没有目标标签可用,因此不能使用传统的监督方法进行域适应。MCD通过最大化分类器在源域和目标域之间的差异,来找到两个领域之间的分界线,并提高分类器的泛化能力。具体来说,MCD使用最大平均散度(Maximum Mean Discrepancy,MMD)来测量源域和目标域之间的相似性和差异性,即通过学习使得源域和目标域的特征分布差异最大化的映射函数,来尽可能减少领域之间的差异。 MCD还可以用于不同类型的域适应问题,包括图像领域、语音领域和自然语言处理领域。在图像领域中,MCD可以用于目标域具有不同光照、角度和尺度情况的情况下的图像分类。在语音领域和自然语言处理领域中,MCD可以帮助训练具有更好鲁棒性的语音识别模型和文本分类模型。 总之,MCD是一种用于非监督式域适应的有效工具,它能够在源域和目标域之间的差异中找到主要的差异,并提高分类器的泛化能力。同时,MCD也是一个可扩展的方法,可以应用于不同领域和问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值