Python/torch/深度学习——语义分割数据集(Semantic-SAM浅读)
文章目录
前言
浅读Semantic-SAM论文的记录
论文网址
一、Open-set segmentation(开放集分割、开集分割)
Open-set segmentation(开放集分割、开集分割)是一项分割任务,旨在对图像中的对象进行分类和分割,即使遇到训练期间不存在的、看不见或未知的类。 在传统的分割任务中,模型在一组固定的类上进行训练,并假设测试数据中的所有对象都属于这些已知的类。 然而,在开放集分割中,模型需要在推理过程中处理未知或新颖类的存在。
开放集分割方法通常结合异常值检测、新颖性检测等技术,或结合附加信息(例如文本描述)来处理未知类。 这些技术帮助模型在分割过程中区分已知类和未知类。开放集分割中使用的具体方法和技术可能因不同的研究论文和模型而异。
二、Interactive segmentation(交互式分割)
Interactive segmentation(交互式分割)是指涉及用户交互以细化或指导图像分割过程的计算机视觉任务。 与全自动分割方法不同,交互式分割允许用户提供输入或反馈,以提高分割结果的准确性和质量。
在交互式分割中,用户通常首先提供初始输入,例如标记或勾画图像中感兴趣的区域。 此初始输入有助于分割算法理解用户的意图并识别目标对象。 基于此输入,算法生成分割掩模或边界,将前景对象与背景分开。用户可以通过提供额外的输入或纠正初始分割中的任何错误来迭代地细化分割。 这种反馈可以是附加标记、笔触或分割系统提供的其他交互式工具的形式。 该算法结合了用户反馈来更新和改进分割结果。
交互式分割技术可用于各种应用,例如图像编辑、对象识别、医学成像等。 通过涉及用户交互,这些方法可以实现更精确和定制的分割结果,特别是在全自动方法可能因复杂或模糊的图像内容而陷入困境的情况下。
交互式分割有不同的方法和算法,并且所使用的具体技术可能因研究论文和应用程序的不同而有所不同。