目标检测算法YOLO1论文解读

最新推荐文章于 2024-04-15 13:44:56 发布

纸上得来终觉浅～

最新推荐文章于 2024-04-15 13:44:56 发布

阅读量1.8k

点赞数 1

分类专栏： paper阅读图像处理文章标签： YOLO1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32172681/article/details/99418000

版权

论文题目：You Only Look Once: Unified, Real-Time Object Detection

论文地址：https://arxiv.org/pdf/1506.02640.pdf

代码地址：https://github.com/hizhangp/yolo_tensorflow

与RCNN系列不同，YOLO将物体检测看作一个单一的回归问题，直接从图像生成bounding box坐标和分类概率。只需要检测一次这张图像，就可以预测图像中存在的物体，并且得到它们所在的具体位置。RPN预测的是预测框和anchor的偏移量，而YOLO预测的是预测边界框中心点相对于对应cell左上角位置的相对偏移值。

一、论文解读

1、Model

YOLO将目标检测视为一个回归问题，它将图像划分为S*S个网格，如果物体的中心落入一个网格中，那么这个网格就负责检测这个物体，以及这些bounding boxes的位置、置信度、类别概率。置信度可以反应这个模型对boxes中是否含有物体和预测精确度的自信程度。定义置信度为：，如果这个网格中没有物体，就定义置信度为0，否则，置信度等于预测框和真实框的交并比。每个bounding box包含5个预测值：x、y、w、h、confidence，其中x、y代表相对与这个网格边界的预测框的中心，w、h为框的宽、高，confidence代表预测box和真实box的交并比IoU。预测结果可以用SxSx（B*5+C）个参数表示。在PASCAL VOC上运行YOLO，S=7，每个格子预测B=2个物体，PASCAL VOC有20个类别

最低0.47元/天解锁文章

纸上得来终觉浅～

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

纸上得来终觉浅～ CSDN认证博客专家 CSDN认证企业博客

码龄9年

151: 原创

17万+: 周排名

172万+: 总排名

90万+: 访问

: 等级

8736: 积分

215: 粉丝

587: 获赞

117: 评论

3282: 收藏

私信

关注

热门文章

分类专栏

语音识别 52篇
linux 3篇
工作
传统图像处理 13篇
数学 4篇
java 40篇
数据结构与算法 14篇
keras 2篇
ocr 2篇
图像处理 56篇
python 15篇
tensorflow 24篇
深度学习 79篇
机器学习 44篇
pandas 1篇
Kaggle 2篇
paper阅读 21篇
其他 39篇

最新评论

边缘检测：Canny算子
Midsummer-逐梦: 原图像
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: 和你一样
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: root@ubuntu:~/kaldi/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:20 --:--:-- 0curl: (7) Failed to connect to phon.ioc.ee port 443: Connection refused gzip: stdin: unexpected end of file tar: Child returned status 1 tar: Error is not recoverable: exiting now
基于Kaldi+GStreamer搭建线上的实时语音识别器
小萌新Z: ot@zpq-virtual-machine:/home/zpq/桌面/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:21 --:--:-- 0 curl: (7) Failed to connect to phon.ioc.ee port 8080 after 21352 ms: 连接被拒绝这是什么问题
语义分割算法Mask RCNN论文解读
惑许414: Traceback (most recent call last): File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 160, in <module> model = ParallelModel(model, GPU_COUNT) File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 38, in __init__ merged_outputs = self.make_parallel() File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 62, in make_parallel for name, x in zip(self.inner_model.input_names, AttributeError: 'Model' object has no attribute 'input_names' 怎么解决呢请问

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。