【跟李沐学AI】week 9b | 物体检测锚框

最新推荐文章于 2024-08-16 20:04:39 发布

大胃羊

最新推荐文章于 2024-08-16 20:04:39 发布

阅读量2k

点赞数

分类专栏：动手学深度学习文章标签：人工智能计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/davidyang_980/article/details/122732618

版权

动手学深度学习专栏收录该内容

15 篇文章 1 订阅

订阅专栏

41 物体检测和数据集

物体检测问题：分类+位置（边缘框）
边缘框的原点是在左上角，一个边缘框可以通过4个数字来定义。
在这里插入图片描述

目标检测数据集：每行表示一个物体，包括图片文件名、物体类别、边缘框，COCO是一个很大的数据集。

42 锚框 anchor

主流的目标检测算法多是基于锚框的，锚框使用流程如下：

提出多个称为锚框的区域
预测每个锚框中是否有所关注的物体（对应类别预测）
如果是，那么预测这个框到真实边缘框的偏移（对应位置的预测），把锚框的位置进行调整

IoU - 交并比
IoU的作用是计算两个框之间的相似度，0表示无重叠，1表示重合，这个Jacquard系数就是交并比。
在这里插入图片描述
赋予锚框标号：
每个锚框都是一个训练样本，要么把它标注为背景，要么关联上一个真实边缘框，一般会生成大量的锚框，所以会有正样本和负样本，并且大多的都可能是负样本。对于每个边缘框都找到一个锚框和它关联，关联的也是IoU最大的。

赋予锚框标号是在读图片后就会进行的一个过程，如果有9个锚框，每个锚框作为一个训练样本，就相当于图片有9个训练样本。
在这里插入图片描述
使用非极大值抑制（NMS）输出
每个锚框会预测一个边缘框，那么需要NMS来合并相似的预测。NMS选中非背景类的最大预测值（确定一个类），去掉所有其它和它的IoU大于阈值的预测（确定一个更精准的框），重复上述过程，使得所有框要么被留住，要么被去掉。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。