cs231n_2018_lecture11_notes_rnn视觉应用

这章节主要讲解RNN能在计算机视觉领域完成什么任务。


目前为止好像都是以线性分类器作基础讲解神经网络的,具体实现比如网络最后一层有4096神经元而我们要做个10分类,那么需要添加10个神经元与前面的4096个神经元全连接,这样输出的10个数值看作是类别得分,分类的概念在之前讲过。但应用绝非局限于图像分类任务。这里就要介绍另外两个常见任务:检测detection和分割segmentation。展开可以分为1.单目标检测(Classification + Localizatio);2.多目标检测object detection;3.语义分割semantic segmentation;4.实例分割instance segmentation

应用1.语义分割semantic segmentation

该任务即从给定的一幅图中按像素点分类,但不同于普通图像分类输出一维标量,它输出的是二维的分割图。

解决方案一:滑动窗口Sliding Window

解决方案二:全卷积Fully Convolutional

解决方案三:全卷积Fully Convolutional+downsampling+upsampling

可参考论文:Long, Shelhamer, and Darrell, “Fully Convolutional Networks for Semantic Segmentation”, CVPR 2015
Noh et al, “Learning Deconvolution Network for Semantic Segmentation”, ICCV 2015

其中上采样upsampling的方法思路基本为刚开始怎样下采样的,然后就采取逆过程完成上采样。

pooling对应逆过程unpooling:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值