语义分割与目标检测入门:若干经典工作综述

本文概述了语义分割和目标检测的关键技术,包括FCN、U-Net、YOLO、SSD以及R-CNN系列。FCN和U-Net通过全卷积实现像素级别分类,YOLO和SSD则采用快速检测方法,而R-CNN家族通过结合分类和回归提升检测精度。
摘要由CSDN通过智能技术生成

语义分割

从原理上来说,语义分割就是像素级别的分类,传统的方法也是直接按照这个思路来做的,效率比较低,而从FCN开始,语义分割有了相对比较专用的方法。

0. 重要的数据集:PASCAL VOC和COCO

1. FCN

用于图像(N×M)分类的网络前端用卷积层提取特征,后端用全连接层进行分类。假设总共有K个类别,则全连接层最后会输出一个1×K的向量。FCN(Fully Convolutional Network,全卷积网络)将用于分类的全连接层替换为(反)卷积层,输出变为N×M×K的向量。

FCN还有一个技巧,如下图所示,用反卷积网络进行上采样的时候把上采样的结果与前面pooling的结果相加,有助于提升结果。

 

2. U-Net

       U-Net是FCN的改进版。针对医学图像提出了U-Net,因此U-Net不用在ImageNet上预训

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值