深度学习-卷积神经网络从入门到精通

第2章预备知识

2.1激活函数

2.2矩阵运算

2.3导数公式

2.4梯度下降算法

2.5反向传播算法

2.5.1通用反向传播算法

2.5.2逐层反向传播算法

2.6通用逼近定理

2.7内外卷积运算

2.8膨胀卷积运算

2.9上下采样运算

2.10卷积面计算

2.11池化面计算

2.12局部响应归一化

2.13权值偏置初始化

2.14丢失输出

2.15丢失连接

2.16随机梯度下降算法

2.17块归一化

2.18动态规划算法

LeNet-AlexNet-SPPNet-VGGNet-GoogLeNet-HighwayNet-ResNet-DenseNet-CatNet-R-CNN-Faster R-CNN-YOLO-SSD-fcn-PSPNet-Mask R-CNN-SiameseNet-SqueezeNet-DGGAN-NIN-Flappy Bird-AlphaGo

YOLO

You Only Look Once 

将目标检测设计为一个回归问题,只用一个神经网络和一次评价,就直接从输入的整幅图像预测边框和类别概率。整个检测流程是一个网络,所以可以直接进行端对端的优化。基准YOLO模型可以每秒实时第处理45帧图像。

YOLO进行目标检测的基本思路,先将输入图像分成SxS个网格。每个网格负责检测中心落在其中的对象目标,并预测B个边框及相应的置信得分。置信得分表示一个边框含有对象目标的可信程度和精确程度有多大,并形式地定义为Pr(Object)*IoU。如果不包含目标,则得分=0;否则,得分为预测边框与真实边框的IoU.每个边框都有5个预测值:x,y,w,h,confidence.其中(x,y)表示边框中心相对网格边界的位置坐标,实际上是用0到1之间的比例系数来表示的;confidence是置信度,定义为预测边框与真实边框的IoU值,实际上也是用0到1之间的比例系数来表示的。confidence 是置信度,定义为预测边框与真实边框的IoU值。此外,每个网格还要预测C个条件类别概率Pr(Class|Object),表示网格包含对象目标的类别概率。每个网格只预测一组类别概率,与预测的边框个数及大小无关。因此,YOLOI的预测结果(或网络输出)可以编码为一个SxSx(Bx5+C)的张量。B个边框。比如PASCAL VOC数据集S=7,B=2,C=20,7X7X30的张量。

类别用one-hot编码表示

在测试阶段,还要给每个边框计算类别有关的置信得分,用来编码类别在边框出现的概率和预测边框对对象目标的拟合好坏。具体计算方式是将条件类别概率与边框的置信度相乘,即

YOLO的网络结构是在GoogLeNet的基础上建立的,这个网络用来处理PASCAL VOC数据集,共有31层(包含输入层),其中有24个卷积层,4个池化层和2个全连接层。(YOLO4-tiny 21个卷积层)

。。。略

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值