综述:基于深度学习的语义分割
什么是语义分割?
深度学习和计算机视觉社区中的大多数人都知道什么是图像分类:我们希望我们的模型告诉我们图像中存在单个对象或场景。分类是非常粗糙和high-level的。
许多人熟悉目标检测,在其中我们试图通过在图像周围绘制边界框然后对框内的内容进行分类来对图像中的多个对象进行定位和分类。目标检测是mid-level,mid-level有一些非常有用且详细的信息,但是由于我们只是绘制边界框而并没有真正了解对象形状,因此它仍然有些粗糙。
语义分割是这三种中最富含信息的,我们希望在其中分类图像中的每个像素,就像您在上面的gif中看到的一样! 在过去的几年中,这完全是通过深度学习来完成的。
在本指南中,您将学习语义分割模型的基本结构和工作原理,以及所有最新和最先进的方法。
如果您想自己尝试模型,可以下载语义分割源码,