深度学习-卷积神经网络从入门到精通

Rain and Star

已于 2023-11-26 16:55:06 修改

阅读量36

点赞数

文章标签：深度学习 cnn 人工智能

于 2023-11-26 14:48:58 首次发布

本文链接：https://blog.csdn.net/RainStar1126/article/details/134606745

版权

第2章预备知识

2.1激活函数

2.2矩阵运算

2.3导数公式

2.4梯度下降算法

2.5反向传播算法

2.5.1通用反向传播算法

2.5.2逐层反向传播算法

2.6通用逼近定理

2.7内外卷积运算

2.8膨胀卷积运算

2.9上下采样运算

2.10卷积面计算

2.11池化面计算

2.12局部响应归一化

2.13权值偏置初始化

2.14丢失输出

2.15丢失连接

2.16随机梯度下降算法

2.17块归一化

2.18动态规划算法

LeNet-AlexNet-SPPNet-VGGNet-GoogLeNet-HighwayNet-ResNet-DenseNet-CatNet-R-CNN-Faster R-CNN-YOLO-SSD-fcn-PSPNet-Mask R-CNN-SiameseNet-SqueezeNet-DGGAN-NIN-Flappy Bird-AlphaGo

YOLO

You Only Look Once

将目标检测设计为一个回归问题，只用一个神经网络和一次评价，就直接从输入的整幅图像预测边框和类别概率。整个检测流程是一个网络，所以可以直接进行端对端的优化。基准YOLO模型可以每秒实时第处理45帧图像。

YOLO进行目标检测的基本思路，先将输入图像分成SxS个网格。每个网格负责检测中心落在其中的对象目标，并预测B个边框及相应的置信得分。置信得分表示一个边框含有对象目标的可信程度和精确程度有多大，并形式地定义为Pr（Object）*IoU。如果不包含目标，则得分=0；否则，得分为预测边框与真实边框的IoU.每个边框都有5个预测值：x,y,w,h,confidence.其中（x,y）表示边框中心相对网格边界的位置坐标，实际上是用0到1之间的比例系数来表示的；confidence是置信度，定义为预测边框与真实边框的IoU值，实际上也是用0到1之间的比例系数来表示的。confidence 是置信度，定义为预测边框与真实边框的IoU值。此外，每个网格还要预测C个条件类别概率Pr(Class|Object)，表示网格包含对象目标的类别概率。每个网格只预测一组类别概率，与预测的边框个数及大小无关。因此,YOLOI的预测结果（或网络输出）可以编码为一个SxSx（Bx5+C）的张量。B个边框。比如PASCAL VOC数据集S=7,B=2,C=20,7X7X30的张量。

类别用one-hot编码表示

在测试阶段，还要给每个边框计算类别有关的置信得分，用来编码类别在边框出现的概率和预测边框对对象目标的拟合好坏。具体计算方式是将条件类别概率与边框的置信度相乘，即

YOLO的网络结构是在GoogLeNet的基础上建立的，这个网络用来处理PASCAL VOC数据集，共有31层（包含输入层），其中有24个卷积层，4个池化层和2个全连接层。（YOLO4-tiny 21个卷积层）

。。。略

Rain and Star

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
深度学习-卷积神经网络从入门到精通

定义为预测边框与真实边框的IoU值，实际上也是用0到1之间的比例系数来表示的。YOLO的网络结构是在GoogLeNet的基础上建立的，这个网络用来处理PASCAL VOC数据集，共有31层（包含输入层），其中有24个卷积层，4个池化层和2个全连接层。在测试阶段，还要给每个边框计算类别有关的置信得分，用来编码类别在边框出现的概率和预测边框对对象目标的拟合好坏。.其中（x,y）表示边框中心相对网格边界的位置坐标，实际上是用0到1之间的比例系数来表示的；2.5.1通用反向传播算法。2.5.2逐层反向传播算法。
复制链接

扫一扫