笔记:Deep multi patch aggregation network for image style, aesthetics and quality estimation

本文介绍了一种利用多补丁(multi patch)表示高分辨率图像并进行风格、美学和质量估计的方法。通过在图像上提取多个补丁并进行特征学习和聚合,提出了统计聚合结构和完全连接排序聚合两种特征融合策略。在训练和测试阶段,使用CNN对每个补丁进行特征提取,并在聚合层进行相应的操作,最终通过全连接层输出用于分类的特征向量。
摘要由CSDN通过智能技术生成

在Image style, aesthetics and quality estimation三类任务中往往需要依靠更多的高像素(high resolution)图片中的细纹理(fine-grained)信息。通常CNN网络的输入是256*256*3的尺寸,通常的做法是,通常的做法是将一个高像素(比如1024*768)图片随机裁剪为一个patch,用这个patch表示整幅图像,这样会丢失掉其余部分的细纹理信息。本文用一个patch集合(multi patch)来表示整个图片。基于multiple patch,文章提出了一种特征学习以及聚集(aggregation)不同patch特征的框架。具体而言,首先在一个图片上提取多个patch,然后为每个patch做特征提取,将各个patch的特征进行聚集,从而得到用于分类的特征。在这个框架上,本文提出了两种用于特征聚集的方法,分别是statistics aggregation structure和fully-connected sorting aggregation。整个框架本文用下图表示:
这里写图片描述
这里的CNN表示下面结构中从input layer到fc256.(没有softmax层)
这里写图片描述
详细的步骤如下:
1) 对图像选择patch,构成patch集;训练阶段随机每个图像随机选取5个patch,测试阶段没个图片随机选取250个patch,每5个构成一个patches集合,作为第(2&

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值