文 / Google 机器感知软件工程师 Hui Fang
机器学习 (ML) 在许多目标明确的领域都表现卓越。答案非对即错的任务有助于训练过程,也可使算法实现其预期目标,无论是正确识别图像中的物体,还是将一种语言适当地翻译成另一种语言。不过,有些领域并没有客观的评估标准。例如,一张照片是否美丽要按其美学价值进行衡量,而美学价值是一个非常主观化的概念。
▲ 一张加拿大贾斯珀国家公园的专业照片
为了探究机器学习能否学习主观性概念,我们引入了一个用于艺术内容创作的实验性深度学习系统:
https://arxiv.org/abs/1707.03491
该系统可模仿一个专业摄影师的工作流程,浏览来自 Google 街景的全景照片,并搜索最佳构图,然后进行各种后期处理操作以制作一张具有美感的图像。我们的虚拟摄影师“浏览”了大约 4 万张全景照片(拍摄地为阿尔卑斯山、加拿大班夫公园和贾斯珀国家公园、加利福尼亚州大苏尔以及黄石公园等),并据此制作出令人印象深刻的照片,根据专业摄影师的评判,有些照片甚至接近专业水准。
训练模型
尽管可使用 AVA 等数据集对美学进行建模,但单纯用它来提升照片品质可能会使照片欠缺某些美感,如照片过度饱和。不过,利用监督式学习正确地学习美学的多个要素可能需要一个标注数据集,而该数据集很难收集。
我们的方法只依赖于专业品质的照片集,无需在之前/之后进行图像比对,也无需任何额外的标签。该方法自动将美学分解成多个要素,每个要素都通过一个耦合的图像操作产生的反面示例进行单独学习。通过使这些图像操作保持“半正交”,我们可以通过快速并且可分离的优化来改善照片的构图、饱和度/HDR 水平及戏剧性光线。
▲ 一张全景照片 (a) 被剪裁成 (b),饱和度和 HDR 强度在 (c) 中得到提升,(d) 中则应用了戏剧性蒙版。每一步都根据所学习的一个美学要素完成。
传统图像滤镜可用于生成饱和度、HDR 细节和构图