Style Neophile: Constantly Seeking Novel Styles for Domain Generalization 阅读笔记

最新推荐文章于 2024-05-20 20:36:51 发布

m0_55193846

最新推荐文章于 2024-05-20 20:36:51 发布

阅读量797

点赞数

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/m0_55193846/article/details/126845685

版权

1.摘要

本文研究了基于领域不变表示学习的领域泛化。这个方向上的现有方法假设一个域可以通过其图像的样式来表征，并使用样式增强数据训练网络，使得网络不偏向于特定的样式分布。然而，这些方法仅限于有限的样式集，因为它们从固定的外部图像集或通过插值训练数据集获得用于增强的样式。为了解决这一限制并最大化风格增强的好处，我们提出了一种新方法，在训练过程中不断合成新的风格。我们的方法管理多个队列以存储到目前为止观察到的样式，并合成其分布与队列中的样式分布不同的新样式。风格综合过程被表述为单调子模块优化，因此可以通过贪婪算法有效地进行。在四个公共基准上的大量实验表明，所提出的方法能够实现最先进的领域泛化性能。

2.引言

DG是通过学习领域不变特征实现的，这些特征捕捉与目标任务相关的语义，同时不偏向领域特定特征。在这种情况下，图像样式被用于表征其域[27,58]；已经证明，减少对样式的模型偏差可以提高泛化能力[5,33]。作为这一想法的一种简单而有效的实现方式，最近研究了风格增强[16,17,51,58]。它允许模型通过增加具有不同样式的训练图像来对特定样式分布无偏。尽管它们已被证明对领域泛化有效，但在风格多样性方面仍有进一步改进的空间；现有的样式增强方法从有限的一组外部图像[17，51]或通过插值源域图像[58]的样式来获得用于增强的样式，这两种方法都导致了有限的样式范围。（问题）

在本文中，我们提出了一个新的框架，以进一步扩大样式增强的好处。关键思想是不断生成新颖和可信的风格，并用合成风格增强训练图像。具体而言，为了新颖，我们的方法生成的合成样式不仅应与源域图像的样式不同，而且应与之前生成的合成风格不同。另一方面，为了合理，它们不应与真实图像样式偏离太多。为了实现高效的样式合成，我们的框架从采样几个原型开始，这些原型很好地代表了源图像样式的整个分布。然后，使用源样式原型和先前合成的新样式来近似模型观察到的样式分布。为了合成新样式，我们首先通过随机噪声抖动源图像样式来生成新样式的可信候选，然后采样这些候选的子集，这些子集是多样的，并且不能很好地由观察到的样式的近似分布表示。使用（1）存储源图像样式和先前合成的新样式的样式队列，以及（2）测量采样的源样式原型和新样式的质量的评分函数，有效地实现了该采样过程。特别地，我们使用单调子模分数函数，以便通过贪婪算法有效地估计接近最佳原型和新样式。

本文的贡献有三个方面：

我们提出了一种新的领域泛化方法，不断综合新颖、多样和可信的风格，以最大化风格增强的泛化效果

我们提出了一种基于样式队列和子模块优化的新框架，用于有效地维护和生成样式

我们的方法在四个公共基准上优于现有的分布式发电技术，特别是在描述大域差异的基准上。

3.方法

方法的总体流程。（1）对于每一次训练迭代，通过网络从源域图像计算源样式。然后，我们将它们排队，并将以前的源样式从源样式队列中取出。（2）选择表示源样式队列的样式分布的源样式原型。（3）通过用随机噪声抖动源样式来生成新样式的候选。（4）我们选择源域原型和以前的小说风格都不代表的小说风格。（5）选定的新样式将排队，先前的新样式在新样式队列中出列。然后，在动态训练过程中，将新样式队列中随机选择的新样式注入到我们的模型中。步骤（2）-（5）每预定义的迭代次数执行一次，以不断寻找新的样式。

之前的假设，我们假设一个域可以通过其他一样的样式来表征。

然后样式不变的表示将很好地推广到任意的不可见域。在此背景下，作为DG的解决方案，我们提出了一种新的框架，用于通过样式增强学习样式不变模型。关键的想法是不断地向CNN提供训练数据，这些训练数据的风格以前从未被观察过，以最大化风格增强的效果。为了实现这一想法，我们的框架不断生成合成的但看似合理的样式，这些样式不同于之前迭代中观察到的样式，并用这些合成样式替换训练图像的样式，同时保留图像的语义信息。

我们确保新颖风格符合两个标准：多样性和合理性。对于多样性，我们寻求在以前的迭代中未观察到的样式。同时，它们应该是可信的，即不太偏离真实源样式的分布，以便提供真实的样式。为此，我们提出了一种新的风格综合方法，包括三个步骤：原型选择、随机抖动和新风格选择。首先，选择一些源样式的代表，称为源样式原型，以非参数方式有效地识别源样式分布（图2（2））。此外，通过用随机噪声抖动源样式来生成新样式的候选（图2（3））。则选择与原型和先前生成的新样式最不同的候选子集作为新样式（图2（4））。通过重复这些步骤，可以不断地合成与观察到的不同的新样式，并将其存储在新样式队列中。本节的剩余部分阐述了小说风格合成的每个步骤。原型选择。我们选择能够很好地表示存储在源样式队列中的源样式分布的mp原型。假设我们有一组源

m0_55193846

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Style Neophile: Constantly Seeking Novel Styles for Domain Generalization 阅读笔记

为了合成新样式，我们首先通过随机噪声抖动源图像样式来生成新样式的可信候选，然后采样这些候选的子集，这些子集是多样的，并且不能很好地由观察到的样式的近似分布表示。使用（1）存储源图像样式和先前合成的新样式的样式队列，以及（2）测量采样的源样式原型和新样式的质量的评分函数，有效地实现了该采样过程。（2）选择表示源样式队列的样式分布的源样式原型。为了实现这一想法，我们的框架不断生成合成的但看似合理的样式，这些样式不同于之前迭代中观察到的样式，并用这些合成样式替换训练图像的样式，同时保留图像的语义信息。
复制链接

扫一扫