gcn语义分割_使用深度学习做语义分割:简介和代码

什么是语义分割?

大多数深度学习和计算机视觉大家庭中的人都知道什么是图像分类:我们想让我们的模型告诉我们,图片中存在的单个物体或场景是什么。分类是一种非常模糊和高层次的任务。

很多人同样对目标检测很熟悉:我们尝试定位和分类图像中的多个物体,手段就是在它们周围画出范围框,并对框内的东西进行分类。检测是一种中层次的任务,我们可以得到一些很有用的细节信息,但由于我们只是画出检测框而没有得到物体的准确形状,所以还是略显粗糙。

语义分割是这三者中信息量最大的,我们对图片中的每一个像素都进行分类,就像你在上方的动态图中看到的那样!最近几年,这些完全是基于深度学习完成的。

在这篇简介中,你将会学到语义分割模型的基本结构和功能,以及最新最棒的高水平成果。

如果你想要自己试一试这些模型,你可以登陆我的语义分割程序组,对于很多这篇指南中出现的模型,那里有我用 TensorFlow 实现的训练和测试!

GeorgeSeif/Semantic-Segmentation-Suite

Semantic Segmentation Suite in TensorFlow. Implement, train, and test new Semantic Segmentation models easily! …http://github.com

基本结构

我将要向你展示的语义分割模型的基本结构在所有的顶尖工作中都存在。这使得实现不同的模型变得异常简单,因为他们几乎全部都有着相同的骨架、构造方法和构造流程。

U-Net 模型可以对这个结构给出很好的阐释。模型左侧表示了任何训练出来可为图片分类任务提取特征的网络。包括了VGGNet, ResNets, DenseNets, MobileNets,和 NASNets!这里你几乎可以用任何你想用的结构。在选择你的用以特征提取的分类网络时,你心中的主要参考指标是网络的均衡。使用一个很深的 ResNet152 可以为你提供很高的准确度,速度却不及 MobileNet。这些在图像分类任务中出现的折衷因素在语义分割中同样存在。你需要记住一个重要的事实:这些骨架将是你设计/选择你的语义分割网络时的主要驱动力,我再强调也不为过。

用于语义分割的 U-Net

特征被提取出来后将在不同的大小被处理,原因有二。首先,你的模型很可能遇到很多不同大小的物体;在不同的尺寸中处理特征图将赋予网络处理不同大小物体的能力。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本课程适合具有一定深度学习基础,希望发展为深度学习之计算机视觉方向的算法工程师和研发人员的同学们。基于深度学习的计算机视觉是目前人工智能最活跃的领域,应用非常广泛,如人脸识别和无人驾驶中的机器视觉等。该领域的发展日新月异,网络模型和算法层出不穷。如何快速入门并达到可以从事研发的高度对新手和中级水平的学生而言面临不少的挑战。精心准备的本课程希望帮助大家尽快掌握基于深度学习的计算机视觉的基本原理、核心算法和当前的领先技术,从而有望成为深度学习之计算机视觉方向的算法工程师和研发人员。本课程系统全面地讲述基于深度学习的计算机视觉技术的原理并进行项目实践。课程涵盖计算机视觉的七大任务,包括图像分类、目标检测、图像分割(语义分割、实例分割、全景分割)、人脸识别、图像描述、图像检索、图像生成(利用生成对抗网络)。本课程注重原理和实践相结合,逐篇深入解读经典和前沿论文70余篇,图文并茂破译算法难点, 使用思维导图梳理技术要点。项目实践使用Keras框架(后端为Tensorflow),学员可快速上手。通过本课程的学习,学员可把握基于深度学习的计算机视觉的技术发展脉络,掌握相关技术原理和算法,有助于开展该领域的研究与开发实战工作。另外,深度学习之计算机视觉方向的知识结构及学习建议请参见本人CSDN博客。本课程提供课程资料的课件PPT(pdf格式)和项目实践代码,方便学员学习和复习。本课程分为上下两部分,其中上部包含课程的前五章(课程介绍、深度学习基础、图像分类、目标检测、图像分割),下部包含课程的后四章(人脸识别、图像描述、图像检索、图像生成)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值