计算摄影——自动构图

构图涉及镜头内元素的布局,常用于图片修图、拍摄建议和图像重匹配。自动构图方法包括基于构图准则、显著图和美学原则。基于显著图的方法可能忽视美学,而基于美学的方法更符合摄影师的审美。常用数据集有CUHKCropping、FlickrCropping和CPCD。A2-RL框架可用于高效搜索裁剪框。
摘要由CSDN通过智能技术生成

        这一章主要讲一下构图的基本概念、应用场景、常用数据集和一些方法。

什么是构图

        我们所说的构图,简单来说就是指镜头的取景范围内,对镜头中所包含的所有元素进行取舍和布局,起到突出主题,交代背景,刻画人物情感,保证图像美感的作用。常见的构图方式主要有:黄金分割构图、三分法构图、居中法构图、引导线构图、三角形构图、曲线构图、重复法构图等。如下图则是三分法构图的示例:

构图的应用场景

        自动构图除了在图片修图上的应用之外,还可以用在拍摄时进行智能推荐构图,指导拍摄者进行前后或者左右的移动,这叫做构图推荐;另外在一些场景中需要将图片放到一个尺寸与其不匹配的地方,这就要求要保留图像的原始重要信息以及目标比例等,这叫做构图重匹配,缩略图生成等。

自动构图的方法

        自动构图这个任务,常见的方法包括基于构图准则的构图方法、基于显著图的构图方法、基于美学的构图方法等。

1、基于构图准则的构图方法

        由于专业摄影中构图有一些构图准则,因此也就引申出了基于构图准则的构图方法,该方法的关键在于如何进行量化,比较常见的是三分法构图,通过判定当前拍摄场景的主体距离三分线四个顶点的距离大小,取四个顶点中距离最短的那个距离作为衡量指标,在不同构图方式中,选择最短距离最小的构图则为最优。

                     

        还有一些其他的构图准则,但是通常比较难去定量的评估,而且对于不同的图像效果也不同,因此应用较少。

2、基于显著图的构图方法

        由于人眼在观察一个场景时,会自动的对感兴趣的区域进行处理而选择性的忽略不感兴趣的区域,这个区域就叫做显著性区域,在构图时,我们也可以应用这特点,基于显著性目标检测的结果来构图。

        基于显著图的构图方法,就是研究如何用最小的裁剪窗口使得注意力总和最大化,注意力总和最大可以定义为图像中所有像素值的和,他是图中的有效信息。

        这个方案可以得到最紧凑的保留目标信息的裁剪结果,可以用于缩略图的生成,但是却缺少对于构图准则和美学质量的考量,可能导致裁剪出来的图像不太美观。

3、基于美学的研究方法 

        基于美学的研究方法更加符合摄影师构图的原理,它会裁剪出美学质量分数更高的区域。一种比较直观的方案,就是对裁剪的框进行美学评估,取美学评分更高的裁剪框就可以了,那么问题就在于,如何快速的找到这个框。

        暴力搜索是一种方案,但是其计算量太高,并不能实际应用,因此借鉴上面方案的思想,我们可以基于显著图预处理的方法,来缩小裁剪框查找的范围。首先训练一个显著目标检测网络,使用它可以得到显著目标区域的初始化框,在它的附近,就可以根据不同大小和比例得到一系列候选的裁剪框,然后用美学评分模块进行评分,如下图:

        除了基于显著图预处理的方案之外,还可以使用基于增强学习的方案,比如A2RL框架,可以更加高效的搜索裁剪框,如下图:

算法总体框架如下:

         先把剪裁的图片进行5层的卷积,然后经过一个全连接层输出一个向量作为Local Feature,并合并上对原图的卷积的结果最为RL算法的输入o_t。其中即时的回报通过把Local Feature 放入预先训练好的网络VFN来获得。因为算法采用的是Actor-Critic框架,所以输出分为两个部分,一个是由Actor输出的action,另一个是由critic输出的对该action的评价。

构图相关的数据集

        CUHK Cropping数据集:由经验丰富的摄影师手动裁剪,共950张图像,覆盖了动物、建筑、人物、风景、夜景、植物、静物,裁剪参数包括裁剪框的左上角和右下角的坐标,每一张图像由三个摄影师进行标注。

        Flickr Cropping数据集:共包括1705张图像,由摄影爱好者进行裁剪,然后由标注人员进行选择。

        CPCD数据集:共包括10798张图像,原图来自AVA、COCO等数据集,每张图生成24个裁剪结果,然后由6个标注人员进行选择,标注出相对美感分数。

参考链接:
A2-RL: Aesthetics Aware Reinforcement Learning for Image Cropping Debang_星如雨グッ!(๑•̀ㅂ•́)و✧的博客-CSDN博客

计算摄影 | 计算机如何学会自动裁剪图片(自动构图)?_小白学视觉的博客-CSDN博客

书籍:《深度学习之摄影图像处理》

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值