论文（三）YOLOv3详解

最新推荐文章于 2022-09-12 15:33:29 发布

weixin_40227656

最新推荐文章于 2022-09-12 15:33:29 发布

阅读量915

点赞数

分类专栏：论文阅读-专业知识积累

本文链接：https://blog.csdn.net/weixin_40227656/article/details/116276892

版权

YOLOv3详解

YOLO v3主要有几个改进点，还是非常赞的：

参考：https://www.zhihu.com/question/269909535

1、类别预测方面主要是将原来的单标签分类改进为多标签分类，因此网络结构上就将原来用于单标签多分类的softmax层换成用于多标签多分类的逻辑回归层。首先说明一下为什么要做这样的修改，原来分类网络中的softmax层都是假设一张图像或一个object只属于一个类别，但是在一些复杂场景下，一个object可能属于多个类，比如你的类别中有woman和person这两个类，那么如果一张图像中有一个woman，那么你检测的结果中类别标签就要同时有woman和person两个类，这就是多标签分类，需要用逻辑回归层来对每个类别做二分类。

2、采用多个scale融合的方式做预测。原来的YOLO v2有一个层叫：passthrough layer，假设最后提取的feature map的size是13*13，那么这个层的作用就是将前面一层的26*26的feature map和本层的13*13的feature map进行连接，有点像ResNet。当时这么操作也是为了加强YOLO算法对小目标检测的精确度。这个思想在YOLO v3中得到了进一步加强，在YOLO v3中采用类似FPN的upsample和融合做法（最后融合了3个scale，其他两个scale的大小分别是26*26和52*52），在多个scale的feature map上做检测，对于小目标的检测效果提升还是比较明显的。虽然在YOLO v3中

最低0.47元/天解锁文章

weixin_40227656

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
论文（三）YOLOv3详解

YOLOv3详解YOLOv3详解YOLO v3主要有几个改进点，还是非常赞的：参考：https://www.zhihu.com/question/2699095351、类别预测方面主要是将原来的单标签分类改进为多标签分类，因此网络结构上就将原来用于单标签多分类的softmax层换成用于多标签多分类的逻辑回归层。首先说明一下为什么要做这样的修改，原来分类网络中的softmax层都是假设一张图像或一个object只属于一个类别，但是在一些复杂场景下，一个object可能属于多个类，比如你的类别中
复制链接

扫一扫