文章目录
一、基本信息
标题:《Fast and accurate object detection in high resolution 4K and 8K video using GPUs》
时间:2018-10-26
出版源:HPEC 2018
论文领域:目标检测(Object Detection)
主要链接:
- homepage:None
- arXiv(Paper):https://arxiv.org/abs/1810.10551
- github:https://github.com/previtus/AttentionPipeline
关键词:yolov2、attention、high resolution
二、研究背景
大多数目标检测论文都是聚焦在低分辨率图像上(特别是VOC、COCO),而低分辨率图像会损失很多细节,并且目前很多设备拍摄的图像或者视频都是高清的(4k/8k)。
如下图所示,一幅高清图像可以识别到更多的目标,如果使用传统的目标检测算法,resize图像后,会丢失很多目标(recall很低)。
因此这篇论文主要针对高清图像/视频来提出有效的目标检测算法,保证准确率和速度。
三、创新点
3.1 概述
论文提出Attention pipeline。第一阶段,将原始图像下采样(downscaling)到低分辨率空间中。在低分辨率中目标检测引导model attention到原图的重要区域。第二阶段,model直接处理原图上的区域,仅限于上述highlighted areas。
这里有个关键词Attention,其概念就是仅关注原图中少数的区域。
注:本文使用YOLOv2算法为基础网络。
主要贡献如下:
We propose a novel method which processes high
resolution video data while balancing the trade-off
of accuracy and performance.We show that our method reduces the number of
inspected crops as compared to a baseline method
of processing all crops in each image and as a result
increases performance by up to 27%.We increase the PASCAL VOC Average Precision
score on our dataset fro