【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递（9 月 21 日论文合集）

最新推荐文章于 2024-07-14 15:25:12 发布

旅途中的宽~

最新推荐文章于 2024-07-14 15:25:12 发布

阅读量272

点赞数

分类专栏：计算机视觉arxiv最新论文文章标签：计算机视觉深度学习人工智能

本文链接：https://blog.csdn.net/wzk4869/article/details/133138897

版权

计算机视觉arxiv最新论文专栏收录该内容

165 篇文章 135 订阅

订阅专栏

文章目录

一、分割|语义相关(10篇)

一、分割|语义相关(10篇)

1.1 Enhancing motion trajectory segmentation of rigid bodies using a novel screw-based trajectory-shape representation

一种新的基于螺旋的轨迹形状表示方法增强刚体运动轨迹分割

https://arxiv.org/abs/2309.11413

在这里插入图片描述
轨迹分割是指将轨迹划分成有意义的连续子轨迹。本文主要研究三维刚体运动的轨迹分割。在文献中的大多数分割方法表示身体的轨迹为点轨迹，只考虑其平移而忽略其旋转。我们提出了一种新的刚体运动轨迹表示，既包括平移和旋转，还表现出几个不变的属性。这种表示包括几何进度率和三阶轨迹形状描述符。从螺旋理论的概念被用来使这种表示的时间不变，也不变的身体参考点的选择。这种新的表示是验证的自我监督分割方法，无论是在模拟和使用人类演示倾倒运动的真实记录。结果表明，与传统的表示相比，具有不同的特征和更一致的分割的连续子运动的更鲁棒的检测。我们相信，其他现有的分割方法可以受益于使用这种轨迹表示，以提高其不变性。

1.2 Towards Robust Few-shot Point Cloud Semantic Segmentation

面向稳健的Few-Shot点云语义分割

https://arxiv.org/abs/2309.11228

在这里插入图片描述
Few-Shot点云语义分割的目的是训练一个模型，以快速适应新的看不见的类，只有少数支持集样本。然而，支持集中的无噪声假设在许多实际的现实世界设置中很容易被违反。在本文中，我们的重点是提高的鲁棒性的Few-Shot点云分割下的噪声支持集在测试时间的不利影响。为此，我们首先提出了一个组件级清洁噪声分离（CCNS）表示学习学习区分性特征表示，分离目标类的清洁样本从噪声样本。利用我们的CCNS分离干净和噪声支持样本，我们进一步提出了一个多尺度度的噪声抑制（MDNS）计划，以消除噪声镜头的支持集。我们在两个基准数据集上对各种噪声设置进行了广泛的实验。我们的研究结果表明，CCNS和MDNS的组合显着提高了性能。我们的代码可在https://github.com/Pixie8888/R3DFSSeg上获得。

1.3 Generalized Few-Shot Point Cloud Segmentation Via Geometric Words

基于几何词的广义Few-Shot点云分割

https://arxiv.org/abs/2309.11222

在这里插入图片描述
现有的全监督点云分割方法在动态测试环境中出现新的类。Few-Shot点云分割算法通过学习适应新类来解决这个问题，牺牲了基类的分割精度，这严重阻碍了其实用性。这在很大程度上促使我们提出了一个更实用的范例，广义的Few-Shot点云分割，这需要模型推广到新的类别，只有几个支持点云，同时保留的能力，分割基类的第一次尝试。我们提出的几何词来表示共享的基础和新的类之间的几何组件，并将它们纳入一个新的几何感知的语义表示，以便于更好地推广到新的类，而不会忘记旧的。此外，我们引入几何原型，引导分割几何先验知识。在S3DIS和ScanNet上的大量实验一致地说明了我们的方法比基线方法的优越性能。我们的代码可从以下网址获得：https://github.com/Pixie8888/GFS-3DSeg_GWs。

1.4 Partition-A-Medical-Image: Extracting Multiple Representative Sub-regions for Few-shot Medical Image Segmentation

医学图像分割：提取多个代表性子区域用于Few-Shot医学图像分割

https://arxiv.org/abs/2309.11172

在这里插入图片描述
Few-Shot医学图像分割（FSMIS）是一种更有前途的解决方案，用于医学图像分割任务，其中高质量的注释自然是稀缺的。然而，目前的主流方法主要集中在从支持图像中提取整体表示与大类内变化的外观和背景，并遇到困难，在适应查询图像。在这项工作中，我们提出了一种方法来提取多个代表性的子区域从一个给定的支持医学图像，使细粒度的选择所生成的图像区域。具体而言，支持图像的前景被分解成不同的区域，随后用于通过设计的区域原型学习（RPL）模块来导出区域级表示。然后，我们引入了一种新的原型表示去偏置（PRD）模块的基础上的双向消除机制，抑制干扰的区域表示的自我支持，多方向自去偏置（MS）块，和支持查询，交互式去偏置（ID）块。最后，组合预测（AP）模块的设计，以平衡和集成多个原型表示学习使用堆叠PRD模块的预测。通过对三个可公开访问的医学成像数据集的广泛实验获得的结果表明，领先的FSMIS方法的一致改进。源代码可在https://github.com/YazhouZhu19/PAMI上获得。

1.5 Multi-grained Temporal Prototype Learning for Few-shot Video Object Segmentation

用于Few-Shot视频对象分割的多粒度时间原型学习

https://arxiv.org/abs/2309.11160

在这里插入图片描述
Few-Shot视频对象分割（FSVOS）的目的是分割查询视频中的对象与一些注释的支持图像定义的相同类别。然而，这项任务很少被探索。在这项工作中，基于IPMT，一个国家的最先进的Few-Shot的图像分割方法，结合外部支持的指导信息与自适应查询指导线索，我们建议利用多粒度的时间指导信息处理的时间相关性的视频数据。我们将查询视频信息分解为一个剪辑原型和一个内存原型，分别用于捕获本地和长期的内部时间指导。帧原型进一步独立地用于每个帧，以处理细粒度的自适应引导，并实现双向剪辑帧原型通信。为了减少噪声记忆的影响，我们建议利用不同的预测区域之间的结构相似性关系和选择可靠的记忆帧的支持。此外，还提出了一种新的分割损失，以提高学习的原型的类别区分度。实验结果表明，我们提出的视频IPMT模型显着优于以前的模型在两个基准数据集。代码可在https://github.com/nankepan/VIPMT上获得。

1.6 GraphEcho: Graph-Driven Unsupervised Domain Adaptation for Echocardiogram Video Segmentation

GraphEcho：基于图驱动的无监督域自适应超声心动图视频分割

https://arxiv.org/abs/2309.11145

在这里插入图片描述
超声心动图视频分割在心脏疾病诊断中起着重要作用。本文研究了无监督域自适应（UDA）超声心动图视频分割，其中的目标是推广模型的源域训练到其他未标记的目标域。现有的UDA分割方法不适合于此任务，因为它们不对局部信息和心跳的周期一致性进行建模。在本文中，我们介绍了一个新收集的CardiacUDA数据集和一种新的GraphEcho心脏结构分割方法。我们的GraphEcho包括两个创新模块，即空间跨域图匹配（SCGM）和时间周期一致性（TCC）模块，它们利用了超声心动图视频的先验知识，即：患者和中心之间一致的心脏结构以及心跳周期一致性。这两个模块可以更好地对齐源域和目标域的全局和局部特征，从而改善UDA分割结果。实验结果表明，我们的GraphEcho优于现有的最先进的UDA分割方法。我们收集的数据集和代码将在接受后公开发布。这项工作将奠定一个新的和坚实的基石心脏结构分割超声心动图视频。代码和数据集可在以下网址获得：https://github.com/xmed-lab/GraphEcho

1.7 GL-Fusion: Global-Local Fusion Network for Multi-view Echocardiogram Video Segmentation

GL-Fusion：用于多视角超声心动图视频分割的全局-局部融合网络

https://arxiv.org/abs/2309.11144

在这里插入图片描述
超声心动图图像的心脏结构分割在心脏病诊断中起着至关重要的作用。多视图超声心动图数据的组合对于增强自动化方法的准确性和鲁棒性是必不可少的。然而，由于视觉差异的数据，推导跨视图上下文信息仍然是一个具有挑战性的任务，和不成熟的融合策略，甚至可以降低性能。在这项研究中，我们提出了一种新的全局-局部融合（GL-Fusion）网络，以联合利用多视图信息的全球和本地，提高超声心动图分析的准确性。具体地，提出了多视图基于全局的融合模块（MGFM）以提取全局上下文信息并探索超声心动图视频中不同心跳周期的循环关系。此外，多视图基于局部的融合模块（MLFM）被设计成从不同视图提取心脏结构的相关性。此外，我们收集了一个多视图超声心动图视频数据集（MvEVD），以评估我们的方法。我们的方法实现了82.29%的平均骰子得分，这表明了7.83%的改进，比基线方法，并优于其他现有的国家的最先进的方法。据我们所知，这是第一次探索超声心动图视频分割的多视图方法。代码可在：https://github.com/xmed-lab/GL-Fusion

1.8 CaveSeg: Deep Semantic Segmentation and Scene Parsing for Autonomous Underwater Cave Exploration

CaveSeg：水下自主洞穴探测的深层语义分割与场景分析

https://arxiv.org/abs/2309.11038

在这里插入图片描述
在本文中，我们提出了CaveSeg -第一个视觉学习管道的语义分割和场景解析水下洞穴内的AUV导航。我们解决的问题，稀缺的注释训练数据，准备一个全面的数据集的水下洞穴场景的语义分割。它包含重要导航标记的像素注释（例如洞穴线、箭头）、障碍物（例如地面平原和头顶层）、水肺潜水员和用于伺服的开放区域。通过对美国，墨西哥和西班牙的洞穴系统进行全面的基准分析，我们证明了基于CaveSeg可以开发强大的深度视觉模型，用于水下洞穴环境的快速语义场景解析。特别是，我们制定了一个新的变压器为基础的模型，计算轻，并提供近实时执行，除了实现国家的最先进的性能。最后，我们探讨了水下洞穴内的水下机器人视觉伺服的语义分割的设计选择和影响。所提出的模型和基准数据集开辟了有前途的机会，自主水下洞穴勘探和测绘的未来研究。

1.9 A Geometric Flow Approach for Segmentation of Images with Inhomongeneous Intensity and Missing Boundaries

一种基于几何流算法的非均匀边缘缺失图像分割

https://arxiv.org/abs/2309.10935

在这里插入图片描述
图像分割是一个复杂的数学问题，特别是对于包含强度不均匀性和紧密堆积的对象之间缺少边界的图像。例如，磁共振（MR）肌肉图像通常包含这两个问题，使得肌肉分割特别困难。在本文中，我们提出了一种新的强度校正和半自动活动轮廓为基础的分割方法。该方法使用的几何流，采用了再生核希尔伯特空间（RKHS）边缘检测器和测地距离惩罚项从一组标记和反标记。我们测试所提出的计划MR肌肉分割和比较一些国家的最先进的方法。为了帮助处理这种特殊类型的图像中的强度不均匀性，一种新的方法来估计使用脂肪分数图像的偏置场，称为先验偏置校正模糊C-均值（PBCFCM），介绍。数值实验表明，该方案导致显着优于比较的结果。所提出的方法的平均骰子值分别为92.5%，85.3%，85.3%的股四头肌，腘绳肌和其他肌肉群，而其他方法至少差10%。

1.10 PLVS: A SLAM System with Points, Lines, Volumetric Mapping, and 3D Incremental Segmentation

PLVS：一个具有点、线、体映射和3D增量分割的SLAM系统

https://arxiv.org/abs/2309.10896

在这里插入图片描述
本文档介绍了PLVS：利用稀疏SLAM、体积映射和3D无监督增量分割的实时系统。PLVS代表点、线、体积映射和分割。它支持RGB-D和立体摄像头，可选择配备IMU。SLAM模块是基于关键帧的，并且提取和跟踪稀疏点和线段作为特征。体积映射相对于SLAM前端并行运行，并且通过融合从关键帧反投影的点云来生成所探索环境的3D重建。PLVS中支持并集成了不同的体积标测方法。我们使用一种新的重投影误差束调整线段。该误差利用可用的深度信息来稳定线段端点的位置估计。一个增量和基于几何的分割方法的实施和集成的RGB-D相机的PLVS框架。我们提出了定性和定量评估的PLVS框架上的一些公开可用的数据集。附录详细介绍了所采用的立体线三角测量方法，并提供了一个推导雅可比矩阵，我们使用的线误差项。该软件是开源的。