YOLOv3: An Incremental Improvement

最新推荐文章于 2023-01-13 08:00:00 发布

zzl_1998

最新推荐文章于 2023-01-13 08:00:00 发布

阅读量236

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40731332/article/details/119762691

版权

目标检测专栏收录该内容

15 篇文章 3 订阅

订阅专栏

code: https://pjreddie.com/yolo/

Backbone: DarkNet-53，输出三种不同尺度的预测结果，每个网格对应3个先验框。N X N X [3 * (4 + 1 + 80)]对应4个bounding box offsets，1个objectness prediction和80个类别预测。

具体来说，在79层得到32倍下采样的结果（13 * 13）；之后通过上采样，并与61层特征进行concat，再经过一定卷积操作后得到16倍下采样结果（26 * 26）；再之后通过上采样，并与36层特征进行concat，再进过一定卷积操作后得到8倍下采样结果（52 * 52）。concat是张量拼接，扩充张量维度。

anchors：用k-means聚类得到先验框尺寸，总共聚类得到9中尺寸的先眼眶，每种下采样尺寸对应3种先验框。例如：再COCO数据集上9个先验框是 (10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。分配上：

在最小的13*13特征图上（有最大的感受野）应用较大的先验框(116x90)，(156x198)，(373x326)，适合检测较大的对象。中等的26*26
特征图上（中等感受野）应用中等的先验框(30x61)，(62x45)，(59x119)，适合检测中等大小的对象。较大的52*52特征图上（较小的感受野）应用
较小的先验框(10x13)，(16x30)，(33x23)，适合检测较小的对象。

聚类过程：对训练集，取出GT bbox的width和height（相对于整张图片的比例），然后用K-means聚9类。得到的结果要转换为相对于栅格边长的比例（w = anchor_w * input_width / downsamples）。

Lable Assignment: YOLOv3只会对1个prior进行计算。通过logistic regression，会使得和GT有最大重叠的box prior的objectness score为1。如果和GT的重叠超过0.5，则会忽略这个预测。

loss

参考：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zzl_1998 CSDN认证博客专家 CSDN认证企业博客

码龄7年

152: 原创

5万+: 周排名

1万+: 总排名

21万+: 访问

: 等级

2752: 积分

329: 粉丝

473: 获赞

188: 评论

1113: 收藏

私信

关注

热门文章

分类专栏

人脸 5篇
Human Pose Estimation 5篇
网络攻防 2篇
数据增强 8篇
Transformer 11篇
tools 2篇
Detectron2 8篇
目标检测 15篇
GAN 5篇
因果 4篇
tensorflow 3篇
Bias 8篇
Denosing
点云框架 5篇
收藏夹 2篇
计算机网络 1篇
点云数据集 1篇
点云道路标志 1篇
硬件 3篇
APP 2篇
Python 2篇
启发式算法 4篇

最新评论

[CVPR‘22] EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks
杨闯今天学习了吗？: 你好，请问论文中哪里说了，我看了好像没看到硬件要求啊
[Tools: tiny-cuda-nn] Linux安装
zzl_1998: 如果装好gcc，安装tiny-cuda-nn时报错：RuntimeError: Error compiling objects for extension。可以试下指明环境所用cuda： vim ~/.bashrc # 添加以下内容 export PATH="/usr/local/cuda-x/bin:$PATH" export LD_LIBRARY_PATH="/usr/local/cuda-x/lib64:$LD_LIBRARY_PATH" # 添加后，执行下列命令 source ~/.bashrc
【点云训练】RandLA-Net Semantic3D
JMU-HZH: up您好我能要一份neighbor的文件吗？我是Linux服务器跑的，如果您看见我的消息，可以回复我一下吗？或者发送到我的邮箱1335026698@qq.com，谢谢您了！
【点云训练】RandLA-Net Semantic3D
极恶狒狒: 确实，解决了吗，我也遇到了
[CVPR-24] HUGS: Human Gaussian Splats
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。