李飞飞计算机视觉-自用笔记(第六周)

11 图像分割、定位、检测

11.1 语义分割

方法1:滑动窗口
问题:效率低下
方法2:全连接卷积网络
问题:计算量太大,耗费内存
方法3:卷积与下采样结合
上采样:按某规则扩充像素
转置卷积:不再是对应元素与卷积核做内积,而是用输入做权重处理卷积核,使输出是带有权重的卷积核的叠加
例:
在这里插入图片描述

11.2 图像分类+定位

通常有两个全连接层,其中一个输出类别及得分,另一个输出坐标及图像的长、宽
分别对应两个损失函数,如Softmax和L2 Loss

11.3 对象识别

对与固定几个类别,根据输入的图片,每当出现目标对象时,框处目标对象并对其进行预测
方法:滑动窗口;选中某些区域后对其进行预测,如果当前的类别中没有此区域所对应的内容,新增一个“背景”类,并将当前区域加入其中
问题1:如何选择区域
方法:使用候选区域,建立点状的候选区域,建立候选清单,如目标检测会给出2000个候选区域
问题2:候选区域尺寸不同
方法:由于候选区域要作为同一个卷积神经网络的输出,故应保证他们的输

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值