VFN模型

论文阅读笔记--VFN模型-2017-Learning to Compose with Professional Photographs on the Web

摘要

照片构图是影响摄影审美的重要因素。然而,由于缺乏适用于各种摄影风格的全局规则,对好作品的美学特性建模是一项极具挑战性的任务。

受拍照思维过程的启发,我们将照片构图问题表述为一个寻找视角的过程,该过程依次检查成对的视角并确定它们的审美偏好。

我们进一步利用网络上丰富的专业照片来挖掘无限的高质量排名样本,并证明可以在不明确建模任何摄影规则的情况下训练美学感知的深度排名网络。

就其架构设计和数据采样方法而言,所得模型简单有效。

它也是通用的,因为它自然地学习任何隐含在专业照片中的摄影规则。实验表明,在两个图像裁剪数据集上,所提出的视图发现网络通过滑动窗口搜索策略实现了最先进的性能。

1.介绍

基于一些研究现象,作者将(Learning-to-compose)学习组合问题公式化为两两视图排序过程。

我们表明,这个学习组合问题可以通过一个简单而强大的视图发现网络(VFN)来有效地解决,该网络被训练为尊重构图好的图像而避免构图差的图像。

VFN由广泛使用的对象分类网络 Imagenet 组成,可选地增加了空间金字塔池化(SPP)层。

VFN没有使用任何复杂的手工特征,而是通过将不同的视图以审美顺序的形式联系起来,从例子中学习最佳摄影实践。

2.之前的工作

总结之前方法要面临的主要挑战:
1)基于规则的特征的有限适用性
2)为训练获取构图信息的困难。现有的方法或数据库通过依靠少数专家[36,10]或众包[26,17,5]来注释和验证训练数据来建立它们的训练数据,这使得难以扩展

在这项工作中,我们用一个易于获得的大规模训练数据驱动的通用模型来解决这些问题。

3.方法

我们使用视角查找网络对图像构图或者视角查找进行建模。

VFN,由一个CNN和一个排序层组成。
VFN将两个视图作为 输入并预测出要一个构图上更加令人愉悦的视图。

VFN通过最小化具有已知审美偏好的图像对的混乱来学习其视觉表示(即,优化CNN的权重)。理想情况下,通过研究大量的例子,VFN学会了构图,就像人类专业人员学会了他们的技能一样。

3.1 挖掘成对排序单元

当给定一幅源图像时,我们根据经验设计了以下裁剪采样策略:
1)我们总是形成原始图像和裁剪对,因为两个随机裁剪之间的美学关系很难定义,因此需要人类验证[5]。
2)为了丰富在不同视图中选择最佳视图时所需的示例集,我们包括了不同比例和纵横比的裁剪。
3)为了最好地利用 I I I 中的信息,我们的目标是最大化 I I I 上裁剪的覆盖范围,同时最小化裁剪之间的重叠。

最终的裁剪采样流程如图2所示:
在这里插入图片描述

3.2 视角查找网络

给定一张图像 I j I_j Ij 和它对应的裁剪 C j n C^n_j Cjn, 则VFN模型的目标函数是学习一个映射函数 Φ ( . ) \Phi(.) Φ(.), 这个函数根据 I j I_j Ij

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
VF辅导:内存变量操作命令及文件操作命令 来源:学生大 2007年11月01日 11:35   一.内存变量操作命令:   1.显示内存变量:   格式:display memory [to printer][to 文本文件名]或      list memory [to printer][to 文本文件名]   说明:   (1).两条命令功能基本相同,仅在显示方式上有所区别,前者是分页显示,后者以滚动方式显示   (2).该命令用于显示已定义的内存变量   (3).加上to printer选项,将在屏幕上显示的同时,送往打印机打印   (4).也可加上"to 文本文件名"选项,在显示的同时将结果传送给指定的文本文件保存.   例:显示已存的内存变量   在命令窗口依次输入执行以下命令,观察结果   m=123.456   n="中国人"   list memory to e:\myvfp\bl.txt   执行完毕后,打开e:\myvfp,可以看到,里面多了一个b1.txt.   2.清除内存变量:   格式1:release 变量名表   格式2:release all [extended]   格式3:clear memory   说明:   (1).格式1清除变量名表指定的内存变量并释放它们所战胜的内存空间.   (2).格式2清除全部内存变量,但在程序中不清除全程变量,如有extended选项,则全程变量也清除.   (3).格式3清除除系统内存变量外的全程和局部内存变量,并释放它们的内存空间.   3.保存内存变量:   格式:save to 文件名   功能:将内存变量保存到指定的文件中   4.恢复内存变量:   格式:restore from 文件名   功能:从指定的文件中恢复内存变量   二.文件操作命令:vfp提供了许多文件操作命令,如文件的查找,打开,关闭,复制,更名及显示等.如果你不dos基础,你会发现,和dos命令有几分相象的.   1.显示文件目录命令:   格式:dir [盘符][路径][to printer]   例如:   dir e:  &&显示e:的表信息的内容   dir *.prg  &&显示当前盘的当前目录下所有扩展名为.prg的文件目录信息    2.关闭文件:   格式1:close all   格式2:close database   格式3:close database all   格式4:close index   格式5:close tables   功能:   (1).格式1关闭除"命令窗口","调试窗口","跟踪窗口"及"帮助窗口"以外的所有内容.   (2).格式2关闭当前数据库.数据库关闭后,与此数据库相关的东西同时关闭.若没有数据库,则该命令关闭所有工作区中打开的自由表及与此表相关的东西.   (3).格式3关闭所有打开的数据库及与此相关的东西.   (4).格式4关闭除结构化复合索引外的所有索引文件.   (5).格式5关闭所有打开的表及其索引文件,但不关闭数据库.   3.文件的复制:   格式:copy file 文件名1 to 文件名2   说明:   (1).该命令可复制任何类型的文件,但要求文件名必须加扩展名;   (2).该命令不能复制已打开的文件.   例:将d盘根目录下的xy子目录中的as.prg复制到A盘上,文件名不变:   copy file d:\xy\as.prg to a:\as.prg   4.文件更名:   格式:rename 文件名1 to 文件名2   说明:该命令用于给磁盘文件改名,文件名一般应带扩展名.如果文件不在当前目录中,应指定扩展名.对已打开的文件不能改名.改名的同时可以更换存放路径,例如:rename d:\xy\as.prg to e:\as1.prg   5.删除文件:   格式1:erase 文件名|   格式2:delete file 文件名|   说明:   (1).这两个命令都用于删除文件,完全相同.被删除的文件应事先关闭,文件名应带扩展名.如被删除的文件不在当前目录下,应指定路径名.在文件名不不允许使用通配符.   (2).若选用问号"?",半打开对话框,可从中选择要删除的文件进行删除操作.例如,在命令窗口输入erase 回车,将弹出对话框.   6.显示文本文件:   格式:type 文本文件名 [to printer|to 输出文件名]   功能:执行该命令,将文本文件的内容输出到屏幕,窗口,打印机或一个文本文件中.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值