YOLOV3个人理解总结

最新推荐文章于 2022-12-23 15:08:06 发布

一头秀发的假程序猿

最新推荐文章于 2022-12-23 15:08:06 发布

阅读量1.6k

点赞数

分类专栏：目标检测物体检测文章标签：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36071362/article/details/120882191

版权

目标检测物体检测专栏收录该内容

8 篇文章 1 订阅

订阅专栏

DBL:代码中的Darknetconv2d_BN_Leaky，是yolo_v3的基本组件。就是卷积+BN+Leaky relu。
resn：n代表数字，有res1，res2, … ,res8等等，表示这个res_block里含有多少个res_unit。
concat：张量拼接。将darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的，拼接会扩充张量的维度，而add只是直接相加不会导致张量维度的改变。
上述参考原文链接：https://blog.csdn.net/litt1e/article/details/88907542

改进点1--anchor聚类，9种：

改进点2--多尺度预测：

作者在3条预测支路采用全卷积的结构，其中最后一个卷积层的卷积核个数是255，是针对COCO数据集的80类：3*(80+4+1)=255，3表示一个grid cell包含3个bounding box，4表示框的4个坐标信息，1表示objectness score。

从图6.7中可以看到， YOLO v3输出了3个大小不同的特征图，从上到下分别对应深层、中层与浅层的特征。深层的特征图尺寸小，感受野大，有利于检测大尺度物体，而浅层的特征图则与之相反，更便于检测小尺度物体，这一点类似于FPN结构。

一头秀发的假程序猿

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
YOLOV3个人理解总结

DBL:代码中的Darknetconv2d_BN_Leaky，是yolo_v3的基本组件。就是卷积+BN+Leaky relu。resn：n代表数字，有res1，res2, … ,res8等等，表示这个res_block里含有多少个res_unit。concat：张量拼接。将darknet中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的，拼接会扩充张量的维度，而add只是直接相加不会导致张量维度的改变。上述参考原文链接：https://blog.csdn.n...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。