语义网络分析图怎么做_那些一键抠图的软件是怎么做到的？这些语义分割方法了解一下...-CSDN博客

本文探讨了语义分割技术，包括经典的灰度分割、条件随机场方法，以及深度学习时代的全卷积网络（FCN）、U-Net、Tiramisu模型等。深度学习通过模型架构如U-Net和Atrous卷积，结合损失函数如交叉熵、焦点损失和Dice损失，显著提升了分割效果。语义分割在自动驾驶、医学影像、场景理解等领域有广泛应用。

摘要由CSDN通过智能技术生成

分类问题是为整个图像分配一个标签，而语义分割则是将从属于同一类的对象看成一个整体，为图像中的每一个像素点分配一个标签。本文对一些经典语义分割方法和基于深度学习的语义分割方法进行了讨论，此外还讨论了常见的选择和应用损失函数的方法。

选自Medium，作者：Bharath Raj，机器之心编译，参与：Geek AI、张倩。

语义分割

经典方法

在深度学习时代到来之前，大量的图像处理技术被用来将图像分割成一些感兴趣的区域（ROI）。下面列出了一些常用的方法。灰度分割
这是最简单的语义分割形式，它包括将一个区硬编码的规则或某个区域必须满足的特定的标签属性赋予这个区域。可以根据像素的属性（如灰度值）来构建这样的规则。「分裂-合并」算法就是一种用到了灰度分割技术的方法。该算法递归地将图像划分成若干子区域，直到可以为划分出的子区域分配一个标签，然后通过合并将相邻的带有相同标签的子区域融合起来。
该方法存在的问题是，规则必须是硬编码的。此外，仅使用灰度信息来表示复杂的类（比如人）是极其困难的。因此，需要特征提取和优化技术来恰当地学习这些复杂类所需的表征形式。

条件随机场
不妨考虑通过训练模型为每个像素分配一个类来分割图像。如果我们的模型不完美，我们可能会得到自然界中可能不存在的带有噪声的分割结果（如图中所示，狗像素与猫像素混合在一起）。

带有狗标签的像素和带有猫标签的像素混合的结果（图 c）。图 d 显示了一个更加符合真实情况的分割结果

可以通过考虑像素之间的先验关系来避免这些问题，如果目标是连续的，那么相邻的邻像素往往具有相同的标签。使用条件随机场（CRF）对这样的关系进行建模。
CRF 是一种用于结构化预测的统计建模方法。与离散分类器不同，CRF 在进行预测之前可以考虑相邻的上下文环境，比如像素之间的关系。这使得它成为语义分割的理想候选建模方案。本节将探讨把 CRF 用于语义分割的方法。
图像中的每一个像素都与一组有限的可能状态相关联。在我们的例子中，目标标签是一组可能的状态。将一个状态（或标签 u）分配给单个像素（x）的成本被称为一元成本。为了对像素之间的关系建模，我们还考虑了将一对标签（u，v）分配给一对像素（x，y）的代价，这被称为成对代价。我们可以考虑相邻的像素对（网格 CRF）或者考虑图像中的所有像素对（密集 CRF）。

密集 CRF vs