前几节课程已经将分类、定位、检测三个问题捋清楚了,利用卷积实现滑动窗口提升了效率,但边框会不准确。
本节为3.5-3.9,目标检测最经典的算法之一,YOLO
一、边框预测(Bounding Box,3.5)
对于滑动窗口来说,很容易出现目标在图像中的位置不完全在窗口中的情况,如课程中的例子
这四个窗口都只是部分包含目标,并且大多数目标都是不规则的。
对于更准确的边框,有YOLO(You Only Live Once),及时行乐算法
不对,是You Only Look Once,只是因为在人群中多看了你一眼算法
You Only Look Once: Unified, Real-Time Object Detectionarxiv.org其主要思想是
对于上节的四分类(行人、车辆、摩托和背景)任务,