精致的像素级别的风格转换 ----- Deep Image Analogy

最新推荐文章于 2024-08-07 10:20:52 发布

Hungryof

最新推荐文章于 2024-08-07 10:20:52 发布

阅读量9.8k

点赞数 8

分类专栏： Paper Reading Deep Learning 深度学习论文阅读文章标签：风格转换深度学习

本文链接：https://blog.csdn.net/hungryof/article/details/73752993

版权

本文介绍了一种像素级别的风格转换方法，不同于传统的全局风格转移，该方法关注图像的局部属性，如颜色和纹理。通过Deep PatchMatch算法，实现了A到A'的对齐映射和风格映射，进而构建A'和B。在预处理、NNF搜索、重建和上采样等步骤中，逐步恢复图像细节，得到精确的风格转换结果。此技术在素描与真实图像转换等方面展现出优秀效果。

摘要由CSDN通过智能技术生成

总说

这里写图片描述
一般情况下，我们只有两幅图片， $A$ 和 $B'$ 。如果以 $A$ 为主体，我们希望得到的图像在内容上与 $A$ 相似，但是一些图像属性（比如颜色，纹理等）与 $B'$ 相似，我们记这样的图为 $A'$ ，同理我们也可以定义 $B'$ 。

与以前风格转换的异同：
以前style transfer的风格是全局的，指的是一种”画风“，这种转换与局部内容关系不大，比如古代山水画的画风或是抽象派的画风等等，是图像全局的风格的表达”。如果是图像属性之间的转换，是pixel级别的风格。
比如上图 $A'$ 具有 $A$ 的轮廓，相应位置的内容几乎是一样的。但是整幅图像的属性（比如颜色，纹理）都变成了 $B'$ 的，即变成了暗黄色以及脸部的纹理也抹去了很多。

基本想法

A : A' : : B : B'

$A:A'::B:B'$
其中

A′ $A'$ 和

B $B$ 是未知的。这样的表示有以下两个约束：
1.

A $A$ 和

A′ $A'$ 是完全对齐的，同理

B $B$ 和

B′ $B'$ 也是。
2.

A $A$ 和

B $B$ 在图像属性上是近似的。（比如颜色，纹理）。
这里写图片描述

作者们认为直接学到从 $A$ 到 $B'$ 的映射是困难的（红色）。这是因为 $A$ 和 $B'$ 具有视觉效果的差异性，在像素上存在misalignment。如果把这种映射分解为
1. $A\to A'$ 的相同位置的映射。（这个是对齐的，spatial位置上，这是后面为什么可以用 $A$ 重建出 $A'$ 的内容的原因）
2. 到以及 $A'\to B'$ 的风格映射。（这个存在着misalignment，所以使用NNF搜索）

现在定义两个映射。 $\Phi_{a\to b}$ 如果表示 $A\to B'$ 的映射，即其将 $A$ 的一个 $p$ 位置的点映射到 $B'$ 的 $p'$ 位置上。那么由于 $A\to A'$ 本身是相同位置点的映射（完全对齐的）， $B$ 和 $B'$ 也是对齐映射。所以 $\Phi_{a\to b}$ 的映射可以认为是 $A$ 或者 $A'$ 到 $B$ 或者 $B'$ 的映射。同理可以定义 $\Phi_{b\to a}$ 。