锚（ Anchor Boxes）

最新推荐文章于 2022-12-02 19:38:53 发布

双木的木

最新推荐文章于 2022-12-02 19:38:53 发布

阅读量729

点赞数

分类专栏：吴恩达深度学习笔记深度学习知识点储备笔记文章标签： python 人工智能机器学习深度学习神经网络

本文链接：https://blog.csdn.net/csdn_xmj/article/details/117046655

版权

笔记同时被 3 个专栏收录

164 篇文章 47 订阅

订阅专栏

吴恩达深度学习笔记

91 篇文章 173 订阅

订阅专栏

深度学习知识点储备

68 篇文章 4 订阅

订阅专栏

来源：Coursera吴恩达深度学习课程

到目前为止，目标检测中存在的一个问题是每个格子只能检测出一个对象，如果想检测出多个对象，可以使用anchor box这个概念。

对于这张图片，继续使用3×3网格，注意行人的中点和汽车的中点几乎在同一个地方，两者都落入到同一个格子中。在检测这三个类别（行人、汽车和摩托车）时，它将无法输出检测结果，所以必须从两个检测结果中选一个。

而anchor box的思路是预先定义两个不同形状的anchor box，把预测结果和这两个anchor box关联起来。一般来说，你可能会用更多的anchor box，可能要5个甚至更多，但对于这个视频，我们就用两个anchor box。此时y的类别标签不再是：

而是重复两次：

前8个（上图中绿色方框标记的参数）是和anchor box 1关联的8个参数，后面的8个参数（橙色方框标记的元素）是和anchor box 2相关联。因为行人的形状更类似于anchor box 1的形状，而不是anchor box 2的形状，所以你可以用这8个数值（前8个参数），编码p_c=1，代表有个行人。然后是车子，因为车子的边界框比起anchor box 1更像anchor box 2的形状，这里第二个对象是汽车，那么绿色方框的所有参数和检测汽车相关。

总结一下，现在每个对象都和之前一样分配到对象中点所在的格子中，以及分配到和对象形状交并比最高的anchor box中。你需要观察哪一个anchor box和实际边界框的交并比更高，不管选的是哪一个，这个对象不只分配到一个格子，而是分配到一对，即（grid cell，anchor box）对，这就是对象在目标标签中的编码方式。所以现在输出y就是3×3×16，上一张幻灯片中你们看到y现在是16维的，或者你也可以看成是3×3×2×8，因为现在这里有2个anchor box，而y是8维的。y维度是8，因为我们有3个对象类别，如果你有更多对象，那么y的维度会更高。

因此，以上就是anchor box的概念，anchor box是为了处理两个对象出现在同一个格子的情况，实践中这种情况很少发生，特别是如果你用的是19×19网格而不是3×3的网格，两个对象中点处于361个格子中同一个格子的概率很低，会出现但出现频率不高。也许设立anchor box的好处在于anchor box能让你的学习算法能够更有针对性，特别是如果你的数据集有一些很高很瘦的对象，比如说行人，还有像汽车这样很宽的对象，这样你的算法就能更有针对性的处理，这样有一些输出单元可以针对检测很宽很胖的对象，比如说车子，然后输出一些单元，可以针对检测很高很瘦的对象，比如说行人。

最后，你应该怎么选择anchor box呢？人们一般手工指定anchor box形状，你可以选择5到10个anchor box形状，覆盖到多种不同的形状，可以涵盖你想要检测的对象的各种形状。还有一个更高级的版本，你们如果接触过一些机器学习，可能知道后期YOLO论文中有更好的做法，就是所谓的k-平均算法（k-means），可以将两类对象形状聚类，如果我们用它来选择一组anchor box，选择最具有代表性的一组anchor box，可以代表你试图检测的十几个对象类别，但这其实是自动选择anchor box的高级方法。如果你就人工选择一些形状，合理的考虑到所有对象的形状，你预计会检测的很高很瘦或者很宽很胖的对象，这应该也不难做。

所以这就是anchor box。

说明：记录学习笔记，如果错误欢迎指正！转载请联系我。

双木的木

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
锚（ Anchor Boxes）

来源：Coursera吴恩达深度学习课程到目前为止，目标检测中存在的一个问题是每个格子只能检测出一个对象，如果想检测出多个对象，可以使用anchor box这个概念。对于这张图片，继续使用3×3网格，注意行人的中点和汽车的中点几乎在同一个地方，两者都落入到同一个格子中。在检测这三个类别（行人、汽车和摩托车）时，它将无法输出检测结果，所以必须从两个检测结果中选一个。而anchor box的思路是预先定义两个不同形状的anchor box，把预测结果和这两个anchor box关联起来。一般来说
复制链接

扫一扫

专栏目录