1、YOLO探测法
滑动窗口弹测法:计算量大。
卷积化的滑动窗口:不够精准,原因:一个物体可能同时存在于多个滑动窗口中。
YOLO探测法
设100x100的图像如下,划分成3x3的9个小格子

在制作数据集时,需要对每个小格子制作对应的y标签,设y标签如下(假设只考虑一个格子中只有一个物体):

每个小格子对应8个元素,则上图最终形成的标签维度为3x3x8
注意:
-
在对每个格子打标签时,y标签内的坐标按照以下标准:格子左上角为原点(0,0),右下角为(1,1)点。
-
物体的宽度和高度可以大于1
-
格子越小,物体出现在同一个格子中的概率越小。</

本文详细介绍了物体检测中的关键算法,包括YOLO(You Only Look Once)探测法,通过3x3网格进行高效物体定位;IOU(Intersection Over Union)用于判断定位准确性,当IOU>0.5时认为预测成功;非极大抑制技术解决重复探测问题,仅保留最高概率的预测框;以及Anchor Box解决同一格子内存在多个物体的状况,通过增加元素数量适应不同大小物体的检测。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



