目标检测学习(吴恩达深度学习)

目标检测

  1. 目标分类与定位(classification with localization)
  2. 滑动窗口的卷积实现
  3. YOLO algorithm
  4. 交并比(Intersection over union)
  5. 非极大值抑制(Non-max suppression)

1.目标分类与定位
训练一个卷积神经网络,标签为类别和边界框的坐标值,labels={c,bx,by,bh,bw}
2.滑动窗口的卷积实现
将FC神经网络转化为卷积神经网络,即,将神经元变为1x1的feature map,将中间的权重相应的变为适当的过滤器
描述
滑动窗口实现目标检测的原理:如将图片分为3x3个区域,依次喂入训练好的卷积神经网络输出结果,输出结果为类别。
这样的话,计算成本比较大。滑动窗口的卷积神经网络则很好的解决了这个问题。
在这里插入图片描述
将全连接层变为卷积层后,我们发现,滑动窗口对应的输出结果(维度为4),刚好对应将整个图片喂入卷积神经网络的左上角的输出结果(维度为1x1x4),所以一个一个喂入滑动的区域与整个图片喂入网络在数学上的形式是一样的。所以只需进行一次前向传播,就可以得到与滑动窗口一样的输出结果,节省了计算成本。
这样的滑动窗口的卷积神经网络仍存在缺点,就是边界框的位置可能不够准确。应为它完全取决去划分的窗口的大小和滑动的步幅。
3.YOLO algorithm
YOLO 解决了滑动窗口边界框位置不准确的缺点。
YOLO将图片分为3x3个区域,在这个图片上进行滑动窗口的卷积网络,输出不再只为类别c,而是{pc,bx,by,bh,bw,c1,c2,c3},pc等于0或1取决去这个格子中是否有图像。bx,by,bh,bw为这个格子中的检测出来的边界框
在这里插入图片描述
假设图片的大小为100x100x3,YOLO输出为3x3x8.

4.交并比
黄色区域为ground truth , 绿色为prediction,IOU为评价标准,一般取IOU大于0.5
在这里插入图片描述
5.非极大值抑制
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值