【平价数据】Creatism：Google的自动风光摄影师

最新推荐文章于 2023-12-14 18:01:36 发布

VIP文章 shenxiaolu1984

最新推荐文章于 2023-12-14 18:01:36 发布

阅读量4k

点赞数 1

分类专栏：论文解读文章标签：深度学习 GAN 谷歌

本文链接：https://blog.csdn.net/shenxiaolu1984/article/details/78933466

版权

Fang, Hui, and M. Zhang. “Creatism: A deep-learning photographer capable of creating professional work.” (2017).

这篇论文借助有限的无标定数据，用深度网络在虚拟自然环境中完成“取景-调色-打光”的摄影过程。所涉及的理论并不复杂，但给出的过程详细，对解决实际问题很有启发。
这里可以看到一些好的结果。

#概述

本文的起点非常简单，绝对算得上“平价数据”：

希望能实现一个自动系统：从街景中生成具有专业水平的摄影作品。

##一个不好使的点子
我们很自然地想到，用AVA直接训练一个“图像－评分”的回归网络：好看的照片评分高，不好看的评分低。之后在街景数据库中采样，输出评分高的结果。

还真不行。

##本文的做法
本文的思路非常朴素：让算法像人一样分步骤处理拍照问题。
这里写图片描述

评分包括：1分（随手乱拍），2分（老百姓拍的正常照片），3分（颇有品味票友），4分最高（专家级）。

当然，这种做法只单独考察了美感的三个方面，不过胜在可行性强。

实现

从500px数据集中，随机从原图裁剪，按照如下参数产生等量的两批数据作为样本的输入：

将裁剪结果占原图比例作为样本的标定值。

使用的Inception v3²作为回归网络。输出结果记为 $\Phi_{crop}$ 。

需要特别说明的是，构图对摄影作品的影响是决定性的。第一步选了一个乌漆墨黑的地方，后面无论怎么调也救回不来了。所以在取景步骤中，要结合整体效果的得分来进行。

对于500px数据集的每一个样本，生成如下两类样本作为样本的输入：

将样本与原图的平均像素值之差作为样本的标定值。0%对应1，大于等于6%对应0，中间线性插值。

使用的Inception v3²作为回归网络。输出结果记为 $\Phi_{saturation}$ 。

##HDR评分网络
对于500px数据集的每一个样本，生成如下两类样本作为样本的输入：

将样本与原图的平均像素值之差作为样本的标定值。0%对应1，大于等于20%对应0，中间线性插值。

使用的Inception v3²作为回归网络。输出结果记为 $\Phi_{HDR}$ 。

使用AVA数据库进行训练。

将一部分AVA图像给专业摄影师评分，可以将AVA评分通过一个线性映射，归一化的本文的1到4分体系中。

网络采用Inception v3²。输出结果记为

关注