本周对YOLO的改进版进行学习,阅读论文YOLO9000:Better,Faster,Stronger,总结如下:
论文主要介绍了:
YOLO v2可以运行在多种分辨率下,可以达到一个速度和准确性之间的平衡。
YOLO9000,是通过联合优化检测和分类可以检测 9000种目标类别,主要通过WordTree实现检测数据集与分类数据集的混合。
提出一种新的联合训练算法,能同时在ImageNet和COCO数据集上进行训练。
现存问题:大多数检测方法受限于小部分目标。
由于标注检测图像十分昂贵,在近几年无法使检测数据集达到和分类数据集相同的规模水平。
解决方法:1)我们改进YOLO基础检测系统,产生最先进的实时检测器YOLO v2。
2)然后利用数据集组合方法(dataset combination method)和联合训练算法(joint training algorithm)对来自ImageNet的9000多个类别以及COCO的检测数据训练了一个模型。
一、更好(Better)
通过分析YOLO系统的缺点做出改进,主要侧重于提高召回率和改进定位,同时保持分类准确性。
为了YOLO v2是一个更精确并且更快的检测器,我们简化网络使其更易学习表示(不是像通常方法,通过扩大网络和组合模型)
1、批标准化(Batch Normalization)批标准化显著改善收、同时消除了对其他形式正则化的需求、也有助于模型正则化、同时可以从模型中删除丢弃(dropout)而不