第2章预备知识
2.1激活函数
2.2矩阵运算
2.3导数公式
2.4梯度下降算法
2.5反向传播算法
2.5.1通用反向传播算法
2.5.2逐层反向传播算法
2.6通用逼近定理
2.7内外卷积运算
2.8膨胀卷积运算
2.9上下采样运算
2.10卷积面计算
2.11池化面计算
2.12局部响应归一化
2.13权值偏置初始化
2.14丢失输出
2.15丢失连接
2.16随机梯度下降算法
2.17块归一化
2.18动态规划算法
LeNet-AlexNet-SPPNet-VGGNet-GoogLeNet-HighwayNet-ResNet-DenseNet-CatNet-R-CNN-Faster R-CNN-YOLO-SSD-fcn-PSPNet-Mask R-CNN-SiameseNet-SqueezeNet-DGGAN-NIN-Flappy Bird-AlphaGo
YOLO
You Only Look Once
将目标检测设计为一个回归问题,只用一个神经网络和一次评价,就直接从输入的整幅图像预测边框和类别概率。整个检测流程是一个网络,所以可以直接进行端对端的优化。基准YOLO模型可以每秒实时第处理45帧图像。
YOLO进行目标检测的基本思路,先将输入图像分成SxS个网格。每个网格负责检测中心落在其中的对象目标,并预测B个边框及相应的置信得分。置信得分表示一个边框含有对象目标的可信程度和精确程度有多大,并形式地定义为Pr(Object)*IoU。如果不包含目标,则得分=0;否则,得分为预测边框与真实边框的IoU.每个边框都有5个预测值:x,y,w,h,confidence.其中(x,y)表示边框中心相对网格边界的位置坐标,实际上是用0到1之间的比例系数来表示的;confidence是置信度,定义为预测边框与真实边框的IoU值,实际上也是用0到1之间的比例系数来表示的。confidence 是置信度,定义为预测边框与真实边框的IoU值。此外,每个网格还要预测C个条件类别概率Pr(Class|Object),表示网格包含对象目标的类别概率。每个网格只预测一组类别概率,与预测的边框个数及大小无关。因此,YOLOI的预测结果(或网络输出)可以编码为一个SxSx(Bx5+C)的张量。B个边框。比如PASCAL VOC数据集S=7,B=2,C=20,7X7X30的张量。
类别用one-hot编码表示
在测试阶段,还要给每个边框计算类别有关的置信得分,用来编码类别在边框出现的概率和预测边框对对象目标的拟合好坏。具体计算方式是将条件类别概率与边框的置信度相乘,即
YOLO的网络结构是在GoogLeNet的基础上建立的,这个网络用来处理PASCAL VOC数据集,共有31层(包含输入层),其中有24个卷积层,4个池化层和2个全连接层。(YOLO4-tiny 21个卷积层)
。。。略