首先说声抱歉,隔了这么久才第一次更新专栏(中间经历了DAC和CVPR的rebuttal,导致拖到了现在)。。
在此期间,也针对这个比赛尝试了一些目标检测算法并做了大量的优化,目前由于Jetson TX2开发板还没到,只能在1080Ti和CPU上进行测速,最终模型精度为0.83mIOU,模型参数量是2.33M,模型大小是9.7M,在1080Ti可以达到342.2fps,在CPU上可以达到30.5fps(去年第一名在Jetson TX2上达到24.55fps,精度为0.697mIOU)。。。言归正传,接下来的几期专栏会分别从实时目标检测算法,数据集分析和指标分析以及一些涨点黑科技进行分析。
场景需求:
给定一张图片,需要实时地识别出图片中的目标并确定其位置。这也是这个比赛比较有趣的地方,极少的目标检测比赛有实时性的要求,而这个需求是更加偏向产品的。通过这个需求分析,就可以快速帮助我们过滤掉一些目标检测算法。
粗筛:
目前目标检测算法可以分为两大派系,(1)Two stage: 以RCNN系为代表,这个派系的突出特点就是准,口号是“目标检测两步走,先找框再修框”。(2)One stage: 以Yolo系,SSD系以及Retinanet为代表,这个派系的突出特点就是快,口号是“目标检测一步走&#x