物体检测-yolo(转载)

图像分类或者图像识别模型简单的检测图像中对象的概率
对象定位是指识别图像中对象的位置,一般用方框来表示对象的位置(包括大小)

定义目标变量
多类图像分类问题的目标变量定义为y^=ci
其中Ci=概率类。例如如果由4个类,则将目标变量定义为
在这里插入图片描述在这里插入图片描述
例如,四个类别分别是 卡车,汽车,自行车,行人,他们的概率表示为C1,C2,C3,C4
在这里插入图片描述
损失函数
设目标变量的值
对象本地化的损失函数将定义为
在这里插入图片描述
在实践中,我们可以预测类别的情况考虑softmax输出使用对数函数(C1,C2,C3,C4,Pc)
由于我们已经定义了目标变量和损失函数,我们现在可以使用神经网络对对象进行分类和本地化

物体检测
构建对象检测的方法是首先构建可以对紧密裁剪的对象图像进行分类的分类器。下图展示出了这种模型的示例,其中模型被训练在汽车的紧密裁剪图像的数据集上,并且模型预测图像是汽车的概率
在这里插入图片描述现在,我们可以使用此模型使用滑动窗口机制来检测汽车。在滑动窗口机制中,我们使用滑动窗口并在每张幻灯片中裁剪图像的一部分。裁剪的大小和滑动窗口大小相同。然后将每个裁剪的图像传递给ConvNet模型,其反过来预测裁剪图像是汽车的概率

在这里插入图片描述在整个图像中进行滑动窗口后,我们调整滑动窗口大小并再次运行,我们多次重复这个过程。由于我们通过大量图像进行裁剪并将其传递给ConvNet,因此这种方法计算成本高且耗时,使整个过程非常缓慢。滑动窗口的卷积实现有助于解决此问题

滑动窗口的卷积实现

在我们讨论使用convents实现滑动窗口之前,让我们分析一下如何将网络的完全链接层转换为卷积层。下图展示出了简单的卷积网络,其具有两个完全连接的层,每个层具有形状(400,)
在这里插入图片描述在1D卷积层的帮助下,可以将完全连接的层转换为卷积层。该层的宽度和高度等于1,滤波器的数量等于完全连接层的形状,如下图所示
在这里插入图片描述我们可以通过1D卷积层替换完全连接层,将完全连接层的转换概念应用到模型的卷积层。1D卷积层的滤波器的数量等于完全连接层的的形状。该表示如下图所示。此外输出softmax层也是形状的卷积层(1,1,4),其中4是要预测的类的数量

在这里插入图片描述现在,我们拓展上面的方法来实现滑动窗口的卷积版本。首先让我们考虑一下我们训练过得ConvNet是如下表示的(没有完全连接层)
在这里插入图片描述假设输入图像的大小是16 * 16 * 3. 如果我们要使用滑动窗口方法,那么我们会将此图像传递给上面的ConvNet四次,每次滑动窗口裁剪出尺寸为14 *14 *3的输入图像的一部分并将其传递给ConvNet。但不是这样,我们将完整的图像16 * 16 * 3直接送入训练好的ConvNet,这导致形状为2 × 2 × 4的输出矩阵。输出举证中每个单元表示可能裁剪的结果和裁剪图像的分类值。例如,下图中输出的左侧单元表示第一滑动窗口的结果。其他单元格表示剩余滑动窗口的操作的结果
在这里插入图片描述其注意,滑动窗口的步幅取决于max pool图层中使用的过滤器的数量。在上面的示例中,max pool层有两个过滤器,因此,滑动窗口以两步的速度移动,从而产生4个可能的输出。使用此技术的主要优点是滑动窗口运行并同时计算所有值。因此此技术非常快。虽然此技术的缺点是边界框的位置不是很精确

YOLO算法
在使用滑动窗口技术时,解决预测精确边框问题的更好算法是yolo。这种算法只需要一个前向传播通过网络来进行预测。
该算法将图像划分为网格,并在每个网格单元上运行图像分类和定位算法,例如,我们由一个256 × 256 大小的输入图像。我们在图像上放置一个3 × 3 的网格
在这里插入图片描述接下来,我们在每个网格单元上应用图像分类和定位算法。对于每个网格单元,目标变量定义为用卷积滑动窗口做一切。由于每个网格的目标变量的形状
在这里插入图片描述
是1 × 9并且有9个(3 × 3)网格单元,因此模型的最终输出是:
在这里插入图片描述Yolo算法的优点是他非常快并且可以预测更精确的边界框。此外,在实践中为了更加准确的预测,我们使用更加精确的网格,例如19 ×19,在这种情况下,目标输出的形状为19 × 19 × 9

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值