ICCV 2019 刷新主流数据集所有评价指标目标检测算法EGNet

在人类视觉感知中,很容易将注意力集中在场景的显着目标上。在计算机视觉的许多问题中,需要类似的机制以允许计算机更好地理解场景。特别是具有明确人类目的的应用场景。

用户的照片通常在背景中很复杂。该算法实际上需要关注用户在拍照时感兴趣的目标(这通常是场景中最重要的目标),然后转到数据库以检索相同和相似的对象。

最近,南开大学媒体计算实验室提出的最新边缘检测和图像过分割(可用于生成超像素)被IEEE PAMI接受。

该研究的第一作者也在微博上说:“这是第一个在最广泛使用的图像分割数据集BSD500上手动平均F-Measure评估值的实时算法。图像分割效果也得到了更新。准确度记录 该算法也是开源的。“

下图显示了EGNet在本文中检测到的重要目标的示例:

算法原理

从EGNet:EGNet: Edge Guidance Network for Salient Object Detection,我们可以看到本文的最大创新是使用边缘信息来指导网络进行重要的目标检测。

这很容易理解,显着性目标和背景之间通常有明显的优势。

从由重要目标数据集标记的掩模中提取边缘并不困难。如何使用边缘信息?

下图显示了作者的算法设计原则:

其核心是更丰富的特征:每个阶段的所有转换层都是有用的,而不是传统的,只要每个阶段的最后一个转换层。这是一种非常通用的技术,基本上是使用什么任务,并且可以实现几行代码。

使用VGG16网络,我们的方法在几个常见数据集上具有最佳性能(最先进的)。在BSDS500基准数据集上进行测试和评估时,F-Measure得分(F-measure)得分为0.811,速度为8 FPS。此外,RCF方法的快速版本实现了0.806和30 FPS的速度。为了证明所提方法的多功能性,我们还将RCF检测的边缘应用于图像分割问题。

我们构建了一个基于VGG16的简单神经网络,得到conv3_1,conv3_2,conv3_3,conv4_1,conv4_2和conv4_3各层的输出。从上图可以清楚地看出,卷积特征逐渐变得粗糙,并且中间层conv3_1,conv3_2,conv4_1和conv4_2包含许多有用的精确细节,并且这些细节不出现在其他层中。

上图显示了RCF网络架构。网络的输入是任何大小的图像,并且网络的输出是相同大小的边缘检测图。我们将每个卷积层的层次特征组合成一个整体框架,并训练所有参数进行学习。由于VGG16的感受域在大小上彼此不同,我们的网络可以学习多尺度,包括低尺度和对象级信息,这些信息将有助于边缘检测。

上图是多尺度算法的流水线图。调整原始图像的大小以构建图像金字塔。然后将这些多尺度图像输入RCF网络以进行前向传送。接下来,我们使用双线性插值将生成的边缘检测图恢复为其原始大小。这些边缘图的简单平均计算产生高质量的边缘图。

BSDS500数据集的评估结果

上图是50年来边缘检测方法性能的总结。我们的方法是第一个获得比人类注释器更好的F-Measure分数的实时系统。

论文地址:https://arxiv.org/pdf/1908.08297v1.pdf

论文源码关注微信公众号:“图像算法”或者微信搜索账号imalg_cn关注公众号

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
目 录 第一章 引言 1 1.1 图像质量评价的定义 1 1.2 研究对象 1 1.3 方法分类 2 1.4 研究意义 3 第二章 历史发展和研究现状 4 2.1 基于手工特征提取的图像质量评价 4 2.1.1 基于可视误差的“自底向上”模型 4 2.1.1.1 Daly模型 4 2.1.1.2 Watson’s DCT模型 5 2.1.1.3 存在的问题 5 2.1.2 基于HVS的“自顶向下”模型 5 2.1.2.1 结构相似性方法 6 2.1.2.2 信息论方法 8 2.1.2.3 存在的问题 9 2.2 基于深度学习的图像质量评价 10 2.2.1 CNN模型 10 2.2.2 多任务CNN模型 12 2.2.3 研究重点 15 第三章 图像质量评价数据集和性能指标 16 3.1 图像质量评价数据集简介 16 3.2 图像质量评价模型性能指标 17 第四章 总结与展望 19 4.1 归纳总结 19 4.2 未来展望 19 参考文献 21 第一章 引言 随着现代科技的发展,诸如智能手机,平板电脑和数码相机之类的消费电子产品快速普及,已经产生了大量的数字图像。作为一种更自然的交流方式,图像中的信息相较于文本更加丰富。信息化时代的到来使图像实现了无障碍传输,图像在现代社会工商业的应用越来越广泛和深入,是人们生活中最基本的信息传播手段,也是机器学习的重要信息源。 图像质量是图像系统的核心价值,此外,它也是图像系统技术水平的最高层次。但是,对图像的有损压缩、采集和传输等过程会很容易导致图像质量下降的问题。例如:在拍摄图像过程中,机械系统的抖动、光学系统的聚焦模糊以及电子系统的热噪声等都会造成图像不够清晰;在图像存储和传输过程中,由于庞大的数据量和有限通讯带宽的矛盾,图像需要进行有损压缩编码,这也会导致振铃效应、模糊效应和块效应等图像退化现象的出现。所以,可以说图像降质在图像系统的各个层面都会很频繁地出现,对图像质量作出相应的客观评价是十分重要且有意义的。为了满足用户在各种应用中对图像质量的要求,也便于开发者们维持、控制和强化图像质量,图像质量评价(Image Quality Assessment,IQA)是一种对图像所受到的质量退化进行辨识和量化的

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值