论文阅读：You Only Learn Once: Universal Anatomical Landmark Detection

最新推荐文章于 2023-06-12 15:52:49 发布

A2333fun

最新推荐文章于 2023-06-12 15:52:49 发布

阅读量821

点赞数

分类专栏：论文阅读

本文链接：https://blog.csdn.net/qq_42042757/article/details/119170089

版权

论文阅读专栏收录该内容

21 篇文章 8 订阅

订阅专栏

Y ou Only Learn Once: Universal Anatomical Landmark Detection

你只学习一次：通用解剖学标志点检测

单位：北大奇迹组
发表：2021MICCAI
源代码地址：源代码

摘要

检测医学图像中的解剖标志点在理解解剖和计划自动化处理方面发挥着重要作用。近年来，已经开发出各种深度神经网络方法自动检测地标。然而，所有这些方法都是单一的，在某种意义上，一个高度专业化的网络被训练为一个单一的任务，比如与一个特定的解剖区域相关的任务。在本次工作中，我们首次研究了“You Only Learn Once (YOLO)”的思想，并开发了一个通用的解剖标志点检测模型，实现了基于混合数据集的端到端训练的多个路标检测任务。模型由一个局部网络和全局网络:局部网络是建立在普遍的想法U-Net用来学习多领域局部特性，全局网络是一个平行重复的扩展卷积序列，提取全局特征以进一步消除地标位置的歧义。值得一提的是，与使用标准卷积训练的模型相比，新的模型设计需要的参数要少得多。我们对头部、手部和胸部的1,588张x射线数据集评估了YOLO模型，共贡献了62个标志物。实验结果表明，我们提出的通用模型比以往在多数据集上训练的模型有很大的改善。它甚至超过了为每个数据集单独训练的模型的性能。

关键词：Landmark Detection · Multi-domain Learning

1、介绍

地标检测在各种医学图像分析任务中起着重要作用[26，25]。例如，椎骨的标志有助于手术计划[2]，它决定了植入物的位置。此外，地标位置可用于医学图像的分割[5]和配准[9]。

由于在医学图像中手动标注地标耗时耗力，近年来发展了许多计算机辅助地标检测方法。这些方法可以分为两类：传统和基于深度学习的方法。
传统方法：
传统的方法旨在设计图像滤波器和提取不变特征，如SIFT [15]。

刘等人[14]提出了一种利用地标之间的空间关系来检测地标的子模型优化框架。
林德纳等人[13]提出了一种使用监督随机森林回归的地标检测算法。与深度神经网络方法相比，这些方法精度较低，鲁棒性较差。

基于深度学习：

Y ang等人[23]利用深度神经网络，并提出了一种深度图像到图像网络，该网络由编码器-解码器架构构建，用于初始化椎骨位置，椎骨位置由另一个ConvLSTM模型演化而来，并由基于形状的网络进行细化。

【23】Deep image-to-image recurrent network with shape basis learning for automatic vertebra labeling in large-scale 3d ct volumes（MICCAI2021）
基于形状基学习的深度图像到图像递归网络用于大规模3d ct体积中的自动椎骨标记

Payer等人[16]提出了一种新的基于CNN的神经网络，该网络将空间配置集成到热图中，并证明了对于地标检测，局部特征是准确的，但可能有歧义，而全局特征消除了歧义，但不太准确[10，27]。

【16】Integrating spatial configuration into heatmap regression based cnns for landmark localization（MIA2019）

最近，Lian等人[12]开发了一个多任务动态转换器网络，用于骨骼分割和利用牙科CBCT进行大规模地标定位，该网络在检测地标时也利用了全局特征。

然而，所有这些方法都是单一的，因为高度专业化的网络是为单个任务训练的，比如与特定解剖区域(如头部、手或脊柱)相关联的任务，通常基于单个数据集，并且不够健壮[24]。开发一个只学一次并适用于所有任务的模型[4，11]，即“你只学一次”是有希望和可取的。我们在文献中首次开发了一个强大的通用模型，用于检测与不同解剖结构相关的标志，每个标志都有一个数据集作为示例。我们的方法试图释放“更大数据”的潜力，因为它利用了所有训练图像的集合，并构建了一个优于单独训练的模型的模型。我们认为，在看似不同的解剖区域之间存在共同的知识，观察到来自不同数据集的地标的局部特征共享一些特征(例如可能位于曲线或表面的拐角、端点、极值等)。);毕竟，它们都是地标。我们试图设计一个模型，能够捕捉这些共同的知识，以获得更多的有效性，同时考虑到不同任务之间的差异。据我们所知，这标志着首次进行这样的landmark检测。

我们的模型名为Global Universal U-Net(GU2Net)，灵感来自于Huang等人的通用设计【4】和局部设计来自【6】。如图1所示，在这里插入图片描述

图1：
（a）：GU2Net模型的结构，由两部分组成，即局部网络和全局网络。

局部网络是一种Unet结构，每个卷积由可分离卷积代替，可分离卷积由通道卷积和点卷积组成。
全局网络是由五个扩展的小核大小的卷积组成的并行复制序列。
（b）分离卷积。每个3x3卷积之后是批处理归一化和Leaky ReLU激活。全局网络以4次下采样的图像和局部热图作为输入，输出4次上采样的热图。