YOLO是《You Only Look Once: Unified, Real-Time Object Detection》的全称。在仔细分析YOLO之前,先来简单讲讲目标检测这个领域吧。
(由于目标检测这方面的内容看的比较少,这篇文章单纯从看过YOLO的视角去写的,在很多知识点和细节方面的东西,等到我都看完了之后,在R-CNN系列文章的论述中在细细品味吧~~(。・_・。)ノ)
基于深度学习的目标检测算法目前比较主流的是两大类:
1.two-stage算法:先使用selective search(启发式方法),或者CNN网络(RPN)产生Region Proposal(目标子区域),在此基础上做分类与回归。
代表便是R-CNN系算法(R-CNN,Fast R-CNN,Faster R-CNN)
这部分的内容没有看完,之后会补上的(。・_・。)ノ
2.one-stage算法:仅使用一个CNN网络直接预测不同目标的类别与位置。
代表便是YOLO,SSD
两种类型比较:two-stage的准确度高,但是相对速度慢。.one-stage算法速度快,准确率相对较低。(附上一张图直观一些吧)
了解了目标检测的简单背景后我们来看看YOLO的网络结构吧~(今天的主角(# ^ . ^ #