CVPR 2020 Oral | 无域标签下高清场景时移变换

最新推荐文章于 2022-11-16 19:31:18 发布

PaperWeekly

最新推荐文章于 2022-11-16 19:31:18 发布

阅读量986

点赞数

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/105803262

版权

本文介绍了CVPR 2020 Oral论文《无域标签的高分辨率白天转换（HiDT）》，该工作在无域标签的情况下，通过分步转换和融合技术实现高分辨率场景图像的时移合成。HiDT方法解决了图像翻译中高分辨率和无标签的挑战，通过结合跳跃连接和AdaIN，实现了高质量的图像转换。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

©PaperWeekly 原创 · 作者｜武广

学校｜合肥工业大学硕士生

研究方向｜图像生成

同一个场景在不同时间段存在着一定的变化，这主要取决于光照对图像的成像的影响，如何通过一个时间段的场景图像在无域标签的情况下合成出不同时间段下的高分辨率场景图像是本文要介绍的 CVPR 2020 oral 中 High-Resolution Daytime Translation Without Domain Labels (HiDT) 所做的工作。

论文标题：High-Resolution Daytime Translation Without Domain Labels

论文来源：CVPR 2020

论文链接：https://arxiv.org/abs/2003.08791

代码链接：https://github.com/saic-mdal/HiDT

论文引入

大部分使用 Mac 系统的用户默认动态壁纸是位于洛杉矶卡特琳娜岛的一天场景变化，对应着清晨、日出、正午、傍晚、入夜、凌晨的时移变化，固定机位间隔拍摄可以作为取景，然而这将花费一天时间。如何利用一张高分辨率图像达到时移自然场景的合成，是 HiDT 要实现的任务，文章称之为 Daytime Translation，图 1 展示了任务效果。

▲ 图1.HiDT在自然场景时移变换的结果图

自然场景的时移变换其实就是图像翻译的一类应用，早期的图像翻译在训练以及推理时都需要域标签，而 MUNIT [1] 和 FUNIT [2] 提出了目标域的几幅图像作为翻译指导，同时期的 StarGAN v2 [3] 更是提出了在一个生成器中根据不同的 style code 实现多域转换，这些或多或少都要有域标签的参与。

在时移场景变换下，域对应于一天中的不同时间和不同的照明，这个域标签定义起来是繁琐的，如何在无域标签的情况下实现高分辨率时移场景的合成是一个大的挑战。

然而大部分图像翻译任务在处理的图像上的尺寸多为中等尺寸，即居多，如何实现高分辨率下（）的图像翻译仍是一个值得研究的问题，同时自然场景时移变换更是面临着不能完全依赖图像色彩空间的全局仿射变换，不能依赖时间戳和高分辨率下如何消去伪影等问题。