经典网络(Yolo)再现,全内容跟踪

关注并星标

从此不迷路

计算机视觉研究院

237869769d223c955b05b83909b27ebd.gif

ac16cf0f7c22725eb0837483a0c8fd8b.gif

12fc28822bdcd08495ea8b1c03a88078.png

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

经典网络(Yolo)

今天接着上一篇的内容继续,内容简单明了,希望可以给您带来一些帮助,消除炎热夏天带来的一丝丝燥热,谢谢!

注:推荐精彩文章

深度学习的昨天、今天和明天

人脸检测与识别的趋势和分析

人脸检测与识别技术(怎么去创新?)


今天首先给大家带来“YOLO”!也被上一篇“Faith”读者说对了,在此也感谢大家的关注与阅读,O(∩_∩)O谢谢

YOLO

b688a43cd8d878ac15d0e6d9159335cb.png

看到这个封面,相信很多很多都阅读过,其实这是一篇“基于回归方法的深度学习目标检测算法”的经典之作,如果兴趣的您,可以再一次阅读。

a33c48883f20fce6809eb0d752f339c1.png

会不会有朋友认为YOLO的缩写是You Only Live Once???O(∩_∩)O,其实是You Only Look Once

325849ad0c24fc63c584a36d74a659b7.png

相比于之前介绍的几个网络,明显高于之前说的几个简单目标检测网络。下面来一个YOLO V2的宣传片!有兴趣的您,可以自己去做一个模型玩一玩,其实过程很不错!(“计算机视觉战队”微信平台的人脸检测与识别技术(怎么去创新?)也有简单的Demo。)

回归正题,开始说内部的内容!

8909dea92a9b5ca02c34d8641c40efc8.png

395481dcf97ca49787deba8245d08510.png

7c3b5a311bf938e830171f24ff139573.png

a68fa6255af25481a2f36d416528316d.png

我自己来总结下YOLO:

YOLO网络的结构和在之前得模型比较类似,主要是最后两层的结构,卷积层之后接了一个4096维的全连接层,然后后边又全连接到7*7*30维的张量上。实际上这个7*7就是划分的网格数,现在要在每个网格上预测目标两个可能的位置及这个位置的目标置信度和类别,也就是每个网络预测两个目标,每个目标的信息有4维坐标信息(中心点坐标+长宽),1个目标的置信度,还有类别数20(因为在VOC数据集上,所以是20),总共就是(4+1)*2+20=30维的张量。这样就可以利用前面4096维的全连接映射特征直接在每个网格上回归处目标检测需要的信息(BBClass)。

Result

d2b91914a81f8e48eeb9658df6095567.png


AttentionNet

52202399187c53201874f42db5175ef6.png

43de7f5c855f2225e0917d170302f3c6.png

0dd2506cec2d171fda9bcda891dba783.png

其实整个过程也是比价间的明了,不断去选择BB 的对角点,改变BB的尺寸大小。

daf887c8019e2a9eb8b9c9c69ed30f96.png

bbe85072843fa5b73f0f83bd6039e196.png

dd28520290cbcbd99af365d6644f4b97.png

cde445d41459280cff1c1dd1b1c634e2.png


最近也在整理资料,后期将分享在平台共享专栏!

d1b5a4e5de200fe0db775767d6b8ee4a.png

(先让它有点神秘感)

未完待续!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值