CS231n 计算机视觉(学习笔记)第十一章 Detection and Segmentation(0822)

本文是关于CS231n课程第十一章的学习笔记,聚焦图像分割和定位。介绍了分割模型的两类,一种是像素级分类的语义分割,另一种是同时分类和分割的全分割。探讨了滑动窗口和全卷积网络在分割中的应用,特别是利用上采样技术来恢复空间信息。此外,还讨论了分类加定位的问题,包括L2、L1和Smooth L1损失函数在定位中的使用,以及Fast R-CNN的RoI池化改进。
摘要由CSDN通过智能技术生成

第十一章 Detection and Segmentation

总的内容包括Segmentation, Localization, Detection
第一小节内容为图像分割,了解图像分割本质是对每个像素点进行分类的过程,为了解决全卷积网络的计算复杂度问题,提出了与降采样相对应的上采样的方法。使用降采样和上采样方法对应,得到完整的End-to-End网络。

一、分割

分割模型其实也会分为两种,一种是只进行分割,将不同类别以像素级分别表示,另一种全分割就是在分割的基础上对每个物体进行分类,其中还要比较复杂的是将某一同类别物体但是不同个体进行分割

Semantic Segmentation主要任务是将每个像素(pixel)做分类
在这里插入图片描述
由于只根据像素进行分类,所以并不对实例进行区分,例如上图中的两个牛都分为牛,这也是语义分割的一个不足之处
思路:

idea1:滑动窗口,将每一个窗口分别计算类别,然后输出
缺点:计算量大,而且效率低,有很多overlap
idea2:Fully Convolutional:要做下采样和上采样

上采样:
upsampling:去池化(unpooling)
Transpose Convolution

实际应用过程中最大化下采样和最大

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值