语义分割与目标检测入门：若干经典工作综述

最新推荐文章于 2024-08-19 16:37:16 发布

da_kao_la

最新推荐文章于 2024-08-19 16:37:16 发布

阅读量4.3k

点赞数

分类专栏： Machine Learning Computer Vision 文章标签：语义分割目标检测深度学习 Segmentation Detection

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/da_kao_la/article/details/83057296

版权

本文概述了语义分割和目标检测的关键技术，包括FCN、U-Net、YOLO、SSD以及R-CNN系列。FCN和U-Net通过全卷积实现像素级别分类，YOLO和SSD则采用快速检测方法，而R-CNN家族通过结合分类和回归提升检测精度。

摘要由CSDN通过智能技术生成

语义分割

从原理上来说，语义分割就是像素级别的分类，传统的方法也是直接按照这个思路来做的，效率比较低，而从FCN开始，语义分割有了相对比较专用的方法。

0. 重要的数据集：PASCAL VOC和COCO

1. FCN

用于图像（N×M）分类的网络前端用卷积层提取特征，后端用全连接层进行分类。假设总共有K个类别，则全连接层最后会输出一个1×K的向量。FCN（Fully Convolutional Network，全卷积网络）将用于分类的全连接层替换为（反）卷积层，输出变为N×M×K的向量。

FCN还有一个技巧，如下图所示，用反卷积网络进行上采样的时候把上采样的结果与前面pooling的结果相加，有助于提升结果。

2. U-Net

U-Net是FCN的改进版。针对医学图像提出了U-Net，因此U-Net不用在ImageNet上预训

最低0.47元/天解锁文章

关注

0
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。