【计算机视觉与深度学习 北京邮电大学 鲁鹏 视频笔记】4. 图像分割&目标检测

计算机视觉识别任务
在这里插入图片描述

1. 语义分割

  • 语义分割思路
    1)滑动窗口
    在这里插入图片描述
    但是这种方法效率太低了,重叠区域反复被计算
    2)全卷积
    在这里插入图片描述
    但是,如果处理过程中保持原始分辨率,对于显存的需求会非常庞大…
    解决方案
    在这里插入图片描述
    上采样?
    在这里插入图片描述
    第二种方法还原的位置可能不对,引入index pooling方法,如下
    在这里插入图片描述
    可学习的上采样:转置卷积
    在这里插入图片描述
    在这里插入图片描述
    例子
    在这里插入图片描述
    在这里插入图片描述
    左边下采样,右边上采样
    在这里插入图片描述

2. 目标检测

1)单目标(分类+定位)
在这里插入图片描述
2) 目标检测:多目标
在这里插入图片描述
CNN利用滑动窗口对图像中所有可能的区域进行分类,计算量巨大!!

后来改进,用区域建议Selective Search选取候选框
在这里插入图片描述
有了R - CNN
在这里插入图片描述
改进之后,有了Fast-RCNN

在这里插入图片描述
Fast-RCNN能实现端对端的网络,其中最主要的贡献就是在裁剪+缩放特征部分实现可导,ROI Pooling

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值