经典网络（Yolo）再现，全内容跟踪

最新推荐文章于 2024-11-11 00:30:00 发布

计算机视觉研究院

最新推荐文章于 2024-11-11 00:30:00 发布

阅读量203

点赞数 1

文章标签：网络算法人工智能 python 编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gzq0723/article/details/124919217

版权

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

计算机视觉研究院专栏

作者：Edison_G

经典网络（Yolo）

今天接着上一篇的内容继续，内容简单明了，希望可以给您带来一些帮助，消除炎热夏天带来的一丝丝燥热，谢谢！

注：推荐精彩文章

深度学习的昨天、今天和明天

人脸检测与识别的趋势和分析

人脸检测与识别技术（怎么去创新？）

今天首先给大家带来“YOLO”！也被上一篇“Faith”读者说对了，在此也感谢大家的关注与阅读，O(∩_∩)O谢谢

YOLO

看到这个封面，相信很多很多都阅读过，其实这是一篇“基于回归方法的深度学习目标检测算法”的经典之作，如果兴趣的您，可以再一次阅读。

会不会有朋友认为YOLO的缩写是You Only Live Once？？？O(∩_∩)O，其实是You Only Look Once。

相比于之前介绍的几个网络，明显高于之前说的几个简单目标检测网络。下面来一个YOLO V2的宣传片！有兴趣的您，可以自己去做一个模型玩一玩，其实过程很不错！（“计算机视觉战队”微信平台的人脸检测与识别技术（怎么去创新？）也有简单的Demo。）

回归正题，开始说内部的内容！

我自己来总结下YOLO：

YOLO网络的结构和在之前得模型比较类似，主要是最后两层的结构，卷积层之后接了一个4096维的全连接层，然后后边又全连接到7*7*30维的张量上。实际上这个7*7就是划分的网格数，现在要在每个网格上预测目标两个可能的位置及这个位置的目标置信度和类别，也就是每个网络预测两个目标，每个目标的信息有4维坐标信息（中心点坐标+长宽），1个目标的置信度，还有类别数20（因为在VOC数据集上，所以是20），总共就是（4+1）*2+20=30维的张量。这样就可以利用前面4096维的全连接映射特征直接在每个网格上回归处目标检测需要的信息（BB和Class）。

Result

AttentionNet

其实整个过程也是比价间的明了，不断去选择BB 的对角点，改变BB的尺寸大小。

最近也在整理资料，后期将分享在平台共享专栏！

（先让它有点神秘感）

未完待续！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

计算机视觉研究院 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。