全监督
文章平均质量分 76
论文
小杨小杨1
这个作者很懒,什么都没留下…
展开
-
MI-SegNet: 基于互信息的超越领域泛化的超声图像分割
针对医学图像分割在不同领域间泛化能力有限的问题,特别是针对超声成像,论文提出了一种新的方法称为MI-SegNet。超声成像的质量很依赖于声学参数的精细调整,这些参数在不同的操作者、设备和环境中都存在差异,导致了领域偏移问题。MI-SegNet利用互信息(MI)来显式地分离解耦解剖特征和领域特征表示,从而可以期望获得更鲁棒的领域无关分割性能。该方法使用两个编码器网络来分别学习解剖和领域特征,分割任务只使用解剖特征图进行预测。通过交叉重建等训练技巧来促进编码器学习到有意义的特征表示。原创 2024-06-07 12:11:28 · 369 阅读 · 0 评论 -
基于扩散动力学模型的乳腺癌在不完整DCE-MRI中的分割
针对现有方法需要完整时间序列数据(尤其是增强后图像)的问题,DKM仅利用预增强图像就能进行有效的乳腺癌分割。DKM隐式地利用了DCE-MRI的血流动力学先验信息,通过建立血流动力学响应函数(HRF)与去噪扩散过程(DDP)之间的关系来实现高质量的分割。DKM由扩散模块(DM)和分割模块(SM)组成,DM可以学习到癌症的血流动力学信息,并提供一个潜在的动力学编码来辅助SM进行分割。实验结果表明,与现有需要完整时间序列的方法相比,DKM仅利用预增强图像就能达到更高的分割性能和鲁棒性。代码地址。原创 2024-06-07 09:48:50 · 365 阅读 · 0 评论 -
基于不确定性的相互学习 用于联合医学图像分类和分割
该论文提出了一种基于不确定性的相互学习(Uncertainty-informed Mutual Learning, UML)框架,用于可靠和可解释的医学图像分析。当前的医学图像分类和分割方法往往更注重相互学习特征和共享模型参数,而忽视了特征和性能的可靠性。UML框架通过引入不确定性因素,利用相互学习来提高分类和分割任务的性能。使用证据深度学习提供图像级和像素级的置信度。然后构建一个不确定性导航器,更好地利用相互特征并生成分割结果。此外,还提出了一个不确定性指导器,用于筛选出可靠的分类掩码。代码地址。原创 2024-06-06 10:33:45 · 591 阅读 · 0 评论 -
利用同时预测节点和边的图神经网络 实现鲁棒的椎骨识别
该论文指出,在CT扫描中自动定位和识别椎骨对于众多临床应用很重要。现有方法大多集中在椎骨的位置定位,忽略了其方向信息。同时,这些方法通常在管道中使用启发式方法,在包含异常信息的实际临床图像中可能表现不太鲁棒。作者提出了一种简单的管道方法,首先使用U-Net进行标准预测,然后采用单一的图神经网络来关联和分类椎骨,并预测其完整的方向信息。为了测试该方法,作者引入了一个新的椎骨数据集,其中包含与椎骨主体相关联的椎弓根检测,形成了一个更具挑战性的地标预测、关联和分类任务。原创 2024-06-06 09:14:55 · 332 阅读 · 0 评论 -
基于协同注意力的视觉-语言嵌入用于机器人手术视觉问题定位回答
医学生和初级外科医生经常依赖于资深外科医生和专家来回答他们在学习手术过程中的问题,但专家通常忙于临床和学术工作,很难提供指导。现有基于深度学习的外科视觉问题回答(VQA)系统只能提供简单的答案,而无法给出答案的位置信息。同时,视觉-语言(ViL)嵌入在这类任务中也鲜有研究。因此,一个能够提供视觉问题定位回答(VQLA)的系统对于医学生和初级外科医生学习和理解手术视频会很有帮助。原创 2024-06-05 08:51:30 · 702 阅读 · 0 评论 -
基于多尺度距离加权神经网络的骨盆骨折分割
骨盆骨折是一种严重的高能损伤。从3D CT图像中分割骨盆骨折对创伤诊断、评估和治疗计划非常重要。手动勾画骨折表面可以逐层进行,但这是一个缓慢且容易出错的过程。自动骨折分割面临着骨盆骨结构复杂以及骨折类型和形状变化大的挑战。该研究提出了一种基于深度学习的自动骨盆骨折分割方法。解剖分割网络:从CT扫描中提取左右髂骨和骶骨。骨折分割网络:进一步从每个掩膜骨区域中分割出骨折。研究者设计并集成了一种基于距离加权的损失函数到3D U-Net中,以提高对骨折边界区域的分割精度。原创 2024-06-04 09:30:52 · 526 阅读 · 0 评论 -
基于三元组一致性学习的单目内窥镜里程计估计
单目图像中深度和姿态的估计对于计算机辅助导航至关重要。由于很难获得深度和姿态的真值标注,无监督训练方法在内窥镜场景中具有广阔的前景。然而,内窥镜数据集缺乏足够的视觉变化多样性,图像三元组中也频繁出现外观不一致的问题。本文提出了一种三元组一致性学习框架(TCL),包括两个模块:几何一致性模块(GC)和外观不一致模块(AiC)。为丰富内窥镜数据集的多样性,GC模块生成合成三元组并通过特定损失函数强制实现几何一致性。为减少图像三元组中的外观不一致,AiC模块引入三元组遮蔽策略来作用于光度损失。代码地址。原创 2024-06-04 09:02:28 · 461 阅读 · 0 评论 -
基于层次原型嵌入GCN的动态结构大脑网络构建 - 使用T1-MRI
直接从T1-MRI中定位关键的大脑区域,而不依赖于预定义的区域或预训练的模块,可以更好地捕捉个体差异。引入了一种对比损失函数,用于约束提取的关键区域原型的层次分布,将大脑结构的层次语义信息嵌入到潜在空间中。采用自注意力机制和图卷积网络(GCN)动态构建关键区域之间的层次相关性,探索它们之间的相关关系。代码地址。原创 2024-05-31 10:12:40 · 331 阅读 · 0 评论 -
基于大脑解剖的MRI分析用于评估结构性MRI中认知功能障碍的临床进展
基于学习的方法,结构性脑部MRI已被广泛应用于评估认知功能障碍(CI)的未来进展。以往的研究通常存在标注训练数据较少的问题,而大规模公共数据库中却存在大量未标注的MRI。即使没有特定任务的标签信息,这些MRI提供的大脑解剖结构也可以直观地提高学习性能。然而,现有研究很少利用这种大脑解剖先验知识。为此,本文提出了一种基于大脑解剖的表示学习(BAR)框架,用于评估基于T1加权MRI的认知功能障碍的临床进展。BAR包括一个预备模型和一个下游模型,共享一个基于大脑解剖的编码器用于MRI特征提取。原创 2024-05-31 09:52:57 · 367 阅读 · 0 评论 -
FE-STGNN: 融合功能连接性和有效连接性的时空图神经网络用于轻度认知障碍诊断
这篇论文提出了一种名为FE-STGNN的方法,用于利用功能性磁共振成像(rs-fMRI)数据进行轻度认知障碍(MCI)的诊断。该方法融合了功能连接性(FC)和有效连接性(EC)两种大脑连接性模式,充分利用了它们的互补信息。构建动态功能和有效连接网络:将功能性大脑网络编码为多个图结构,以捕捉时空动态特征。时空图卷积处理:采用空间图卷积网络处理图的结构特征和时间动态特性。位置编码交叉注意融合:设计了一种利用EC时间演化的因果关联来指导FC网络融合的注意力机制。原创 2024-05-30 09:30:57 · 526 阅读 · 0 评论 -
可学习的细分图神经网络在功能性脑网络分析和可解释认知障碍诊断中的应用
该文章提出了一种可学习的细分图神经网络(Learnable Subdivision Graph Neural Network, LSGNN)用于功能性脑网络分析和可解释的认知障碍诊断。背景:大脑的不同功能配置,也称为"大脑状态",反映了大脑认知活动的连续流。这些不同的大脑状态可以赋予大脑网络以异质的功能。从功能性大脑网络中提取信息对神经科学分析和大脑障碍诊断很有帮助。原创 2024-05-30 09:20:03 · 802 阅读 · 0 评论 -
基于掩码自注意力机制的白内障手术后视力预测的不完整多模态学习
论文提出了一种新颖的框架,利用掩码自注意力机制来预测白内障手术后的视力情况。该方法使用术前图像和患者人口统计数据作为输入,利用多模态信息,这与现有仅依赖单一模态数据的方法不同。该方法还针对不完整的多模态数据问题,采用注意力掩码机制来提高鲁棒性。该框架首先使用高效的Transformer提取每个模态的特征,然后利用注意力融合网络结合多模态信息。该方法在1960名白内障手术患者的数据集上进行了评估代码地址。原创 2024-05-29 09:40:46 · 1008 阅读 · 0 评论 -
基于通用Transformer的多模态青光眼识别框架:表征、对齐和融合
这篇论文提出了一个基于Transformer的通用多模态青光眼诊断框架(MMRAF)。主要包含以下三个创新点:双向对比对齐(Bilateral Contrastive Alignment, BCA)模块:将不同模态(CFP和OCT)的特征映射到相同的语义空间,减小跨模态的语义差距。多实例学习表征(Multiple Instance Learning Representation, MILR)模块:对OCT扫描图像进行聚合,学习其语义结构特征,同时降低OCT分支的尺度。原创 2024-05-29 09:19:54 · 480 阅读 · 0 评论 -
病变感知对比学习用于糖尿病视网膜病变诊断
糖尿病视网膜病变(DR)的早期诊断和筛查对于降低患者视力丧失风险至关重要。然而,在实际临床情况下,对眼底图像中的病变区域进行人工标注耗时费力。对比学习(CL)由于其在无需额外标注数据的情况下学习不变表征的能力,最近在自监督表征学习方面表现出色。本研究中旨在探讨CL如何应用于提取医学图像中的病变特征。然而,直接将CL引入深度学习框架是否能增强病变特征的表征能力?我们的研究表明答案是否定的。由于医学图像中的病变区域较为细微,直接引入CL不可避免地会导致假阴性效应,限制判别性表征学习的能力。原创 2024-05-28 09:36:29 · 347 阅读 · 0 评论 -
基于眼底增强的疾病感知蒸馏模型用于OCT图像的视网膜疾病分类
光学相干断层扫描(OCT)是一种新颖且有效的眼科检查筛查工具。由于采集OCT图像相对比眼底照片更昂贵,现有方法采用多模态学习,通过眼底图像提供额外的上下文信息以弥补有限的OCT数据。然而,多模态框架需要同时拥有两种模态的配对数据集,这在临床使用中不切实际。本文提出了一种类别原型匹配方法,以从眼底模型中蒸馏与疾病相关的信息到OCT模型,以及一种新的类别相似性对齐方法,以强制两种模态的疾病分布一致。代码地址。原创 2024-05-28 09:24:09 · 346 阅读 · 0 评论 -
集成Vision Transformer 的概率模型改进了复杂的息肉分割
结直肠息肉在结肠镜检查中被发现,与结直肠癌密切相关,因此息肉分割是诊断和治疗计划的重要临床决策工具。然而,准确的息肉分割仍然是一个具有挑战性的任务,尤其是在涉及微小息肉和其他肠道物质导致高假阳性率的情况下。以往基于监督二值掩码的息肉分割网络可能缺乏对息肉的全局语义感知,导致在复杂场景中对息肉的捕捉和区分能力不足。本文提出了一种新颖的高斯概率引导语义融合方法,该方法逐步融合息肉位置的概率信息与由二值掩码监督的解码器。原创 2024-05-27 09:18:39 · 530 阅读 · 1 评论 -
自反馈 Transformer:一种针对真实世界胰腺神经内分泌肿瘤数据的多标签诊断模型
计算机辅助诊断(CAD)是一个新兴领域,但大多数模型在处理现实世界中的医疗数据时,特别是在罕见肿瘤如胰腺神经内分泌肿瘤(pNENs)的情况下,难以应对缺失和噪声数据的问题。多标签模型可以满足现实世界研究的需求,但当前的方法并未充分考虑缺失和噪声标签的问题。本研究引入了一种名为自反馈 Transformer(Self-feedback Transformer, SFT)的多标签模型,该模型利用 Transformer 来建模标签与图像之间的关系,并采用一种巧妙的自反馈策略来提高标签的利用率。原创 2024-05-27 09:03:03 · 677 阅读 · 0 评论 -
3D牙科网格分割使用基于语义的特征学习与图变换器
本文提出了一种新颖的基于语义的牙科网格分割方法,该方法利用了网格单元的语义信息,并通过精心设计的图Transformer更准确地捕捉了局部和非局部的依赖关系。此外,他们还对跨域特征进行了自适应特征聚合,以获得高质量的基于单元的3D牙科网格分割结果。代码地址。原创 2024-05-26 21:05:06 · 390 阅读 · 0 评论 -
TabAttention:基于表格数据的条件注意力学习
医疗数据分析通常结合成像数据和表格数据处理,使用机器学习算法。尽管先前的研究探讨了注意力机制对深度学习模型的影响,但很少有研究将注意力模块与表格数据相结合。本文介绍了一种名为TabAttention的新模块,该模块通过在卷积神经网络(CNNs)中引入条件性训练的注意力机制来提升模型性能。具体来说,研究者将卷积块注意力模块扩展到3D,通过添加时间注意力模块,利用多头自注意力机制来学习注意力图。此外,他们通过整合表格数据嵌入来增强所有注意力模块。原创 2024-05-26 20:53:28 · 482 阅读 · 0 评论 -
HACL-Net:基于MRI的胎盘植入谱诊断的分层注意力和对比学习网络
胎盘植入谱(PAS)可能导致诸如分娩时大量失血等高风险。因此,使用MRI进行产前筛查对于确保更好的临床结果至关重要。在计算机辅助PAS诊断中,现有工作大多直接从感兴趣区域(ROI)提取放射组学特征,忽略了上下文信息,或者在有限的焦点区域意识下学习全局语义特征。此外,它们通常选择单个或少数几张MRI切片来代表整个序列,这可能导致决策偏差。为了解决这些问题,提出了一种新颖的端到端分层注意力和对比学习网络(HACL-Net),并在多实例问题的框架下进行设计。原创 2024-05-25 21:29:09 · 312 阅读 · 0 评论 -
基于放射组学的深度学习用于左心房CT图像中房颤亚型的分类
房颤(Atrial Fibrillation, AF)以快速、不规则的心跳为特征,可能导致心力衰竭等致命并发症。该疾病根据严重程度分为两个亚型,可以通过CT图像进行自动分类以筛查严重病例。然而,现有的分类方法依赖于通用的放射组学特征,这些特征可能并不适合该任务,同时深度学习方法往往会对高维体积输入产生过拟合。本文提出了一种新的基于放射组学信息的深度学习方法(RIDL),结合深度学习和放射组学方法的优势,以改进AF亚型分类。原创 2024-05-25 16:24:57 · 251 阅读 · 0 评论 -
基于T1和多b值DWI的具有注意力机制的分层融合网络合成对比增强乳腺MRI
研究团队开发了一种多序列融合网络,用于合成对比增强MRI(CE-MRI),该技术基于T1加权MRI和扩散加权成像(DWI)。这项研究旨在减少或避免使用基于钆的造影剂(GBCA),从而减轻对患者的负担。他们通过融合不同b值的DWI,以有效利用DWI的差异特征。此外,他们还引入了一个多序列注意力模块,以获得精细的特征图,并利用了模型驱动方法中不同序列的贡献。这项研究结果表明,基于多b值DWI的融合模型在合成CE-MRI方面具有潜在应用前景。代码地址。原创 2024-05-24 09:20:00 · 372 阅读 · 0 评论 -
腹部多器官分割的眼动引导双路径网络
这项研究提出了一种新的方法,名为眼动引导双路径网络(Eye-Guided Dual-Path Network,EG-DPN),用于腹部多器官分割。这项工作的主要目标是提高医学影像分析中的多器官分割准确性,并减少对高成本手动标签的需求。研究团队发现,通过记录放射科医生在阅读腹部图像时专注的区域的眼动信息,可以有效地指导网络模型关注分割任务所需的相关对象或特征。因此,他们提出了一种方法来整合这种眼动信息,并将其与图像信息相结合,以提高分割模型的性能。原创 2024-05-23 12:09:21 · 295 阅读 · 0 评论 -
All-In:局部-全局图驱动的基于蒸馏的十亿像素组织病理学图像表示学习模型及其在癌症风险评估中的应用
对于组织病理学图像分析中的疾病诊断,机器学习模型的效用已经得到了广泛研究。然而,对于患者风险分层的努力相对较少。在本研究中,探索了在图形神经网络中结合全局和局部特征进行患者风险分层的方法。提出的网络结合了精细和粗糙的组织病理学模式,并利用它们的相互作用来改善风险分层。代码地址。原创 2024-05-22 10:16:40 · 422 阅读 · 0 评论 -
HIGT:用于全景切片图像分析的层次交互图-Transformer
在计算病理学领域,全景切片图像(WSIs)的金字塔结构被用于捕捉从单个细胞相互作用到组织微环境的各种信息。这种层次结构对癌症诊断和预后任务非常有用。然而,先前的层次WSI分析方法主要存在两个问题:第一,只关注WSI金字塔内的局部或全局关联;第二,使用的不同分辨率之间的交互是单向的,导致对WSI金字塔的描述不够全面。为了应对这些问题,本文提出了一种新颖的层次交互图-Transformer(Hierarchical Interaction Graph-Transformer, HIGT)。原创 2024-05-22 10:06:09 · 624 阅读 · 0 评论 -
基于全景切片图像的癌症生存预测:多视角分析驱动的层次图Transformer
癌症生存预测不仅需要考虑肿瘤的生物形态,还需要考虑肿瘤与周围组织的上下文交互。以往基于全景切片图像(WSI)进行生存预测的学习框架的主要局限在于对病理成分(如肿瘤、基质、淋巴细胞等)之间的上下文交互缺乏足够的表示和量化。为了解决这一问题提出了一种多视角分析驱动的层次图Transformer(Hierarchical Graph Transformer,HGT)。方法多视角分析策略:利用切片内的超像素分析和跨切片的聚类分析,挖掘WSIs的空间和语义先验。层次图卷积网络。原创 2024-05-22 09:35:25 · 596 阅读 · 0 评论 -
基于混合Transformer-CNN模型的多分辨率学习方法的解剖学标志检测
精确定位解剖标志点在临床诊断、治疗规划和研究中具有重要作用。现有大多数深度学习方法主要依赖于热图回归学习,该方法生成的标签表示为以标记坐标为中心的二维高斯分布,并将其整合到单一空间分辨率的热图中。然而,这种方法的精度受到热图分辨率的限制,难以捕捉更细微的细节。方法在本研究中,我们引入了一种多分辨率热图学习策略,使网络能够通过独立生成的多分辨率热图,精确捕捉语义特征表示,从而提高定位精度。原创 2024-05-21 09:22:26 · 372 阅读 · 0 评论 -
TSegFormer: 3D Tooth Segmentation in Intraoral Scans with Geometry Guided Transformer
TSegFormer: 高精度3D牙齿分割的多任务Transformer网络背景与挑战口内扫描仪(IOS)在数字牙科中广泛使用,提供牙冠和牙龈的详细三维信息。准确的3D牙齿分割对各种牙科应用至关重要。然而,现有方法在处理复杂边界时容易出错,且在不同患者间表现不佳。方法本文提出了一种名为TSegFormer的新方法,通过多任务3D Transformer架构捕捉IOS点云中不同牙齿和牙龈之间的局部和全局依赖关系。原创 2024-05-21 09:15:51 · 237 阅读 · 0 评论 -
Merging-Diverging Hybrid Transformer Networks for Survival Prediction in Head and Neck Cancer
头颈癌(HNC)由于其复杂性和患者预后差异大,提出了重大挑战。准确的生存预测对于个性化治疗计划至关重要。当前的方法常常由于影像和临床数据的异质性而表现不佳,导致预测效果不理想。为了解决这些挑战,我们提出了一种新型的合并-分歧混合Transformer网络(MDHT-Net),旨在通过有效整合多种数据源来预测HNC患者的生存结果。MDHT-Net结合了卷积神经网络(CNN)和Transformer架构的优势,从包括医学影像和临床记录在内的多模态数据中捕捉局部和全局特征。原创 2024-05-20 10:34:37 · 310 阅读 · 0 评论 -
ProtoASNet:用于超声心动图中主动脉瓣狭窄分类的动态原型网络,具备内在可解释性和不确定性意识
主动脉瓣狭窄(Aortic Stenosis, AS)是一种常见的心脏瓣膜疾病,准确及时的诊断对于适当的治疗至关重要。目前大多数自动检测AS严重程度的方法依赖于黑箱模型,这些模型的信任度较低,阻碍了其在临床中的应用。为了解决这一问题,本文提出了一种名为ProtoASNet的原型网络,该网络直接从B模式超声心动图视频中检测AS,同时基于输入和学习到的时空原型之间的相似性进行可解释的预测。原创 2024-05-20 10:14:38 · 1118 阅读 · 0 评论 -
基于Transformer的端到端可变长度体数据分类
在自动分类3D医学数据时,内存占用问题和样本切片数量的差异是两个主要挑战。传统的解决方案如子采样虽然能解决这些问题,但可能会丢失重要的诊断信息。Transformer在序列数据分析中显示了良好的性能,但其在处理长序列时,数据、计算和内存需求都非常高。本文提出了一种基于Transformer的端到端框架,能够高效分类可变长度的体数据。输入数据随机化在训练过程中,通过随机化输入的体数据分辨率(即切片数量),增强了分配给每个体数据切片的可学习位置嵌入的能力。原创 2024-05-17 09:55:15 · 543 阅读 · 0 评论 -
IVOCT中基于Vision Transformer的多类病变检测
心血管疾病是一种高致死率的疾病。血管内光学相干断层扫描(IVOCT)技术可以显著帮助诊断和治疗心血管疾病。然而,从数百张IVOCT图像中定位和分类病变是一项耗时且具有挑战性的任务,尤其对于初级医生而言更是如此。因此,一种自动病变检测和分类模型是非常可取的。为了实现这一目标,在本研究中,首先收集了一个IVOCT数据集,包括来自69个IVOCT数据的2,988张图像,以及跨三个类别的4,734个病变标注。原创 2024-05-17 09:35:44 · 400 阅读 · 0 评论 -
基于三维超声成像的颈动脉粥样硬化监测的可解释深度生物标志物
本文开发了一种名为Siamese Change Biomarker Generation Network(SCBG-Net)的可解释深度生物标志物,用于评估治疗对颈动脉粥样硬化的影响。SCBG-Net基于从三维超声(3DUS)图像中提取的血管壁和斑块体积及纹理特征进行评估。SCBG-Net是第一个用于连续监测颈动脉斑块变化的深度网络。SCBG-Net自动整合从3DUS中提取的体积和纹理特征,生成一个称为AutoVT(自动整合体积和纹理特征)的变化生物标志物,该标志物对饮食治疗敏感。原创 2024-05-17 09:26:12 · 283 阅读 · 0 评论 -
STAR-Echo:一种使用时空分析和基于Transformer的影像组学模型预后慢性肾脏病患者 MACE 预后的新型生物标志物
慢性肾脏病(CKD)患者患有主要不良心血管事件(MACE)的风险较高。超声心动图评估左心室(LV)功能和心脏异常。LV壁(LVW)的病理生理学和收缩期/舒张期功能与CKD患者的MACE结果(O-和O+)相关联。然而,传统的基于LV容积的测量,如射血分数,其预测价值有限,因为它们仅依赖于末期帧。我们假设通过时空分析,对比分析LVW的形态可以预测CKD患者的MACE风险。然而,由于噪声、分辨率低和需要手动干预,准确地描绘和分析每个帧的LVW是具有挑战性的。原创 2024-05-16 10:08:33 · 736 阅读 · 0 评论 -
一种新型多任务模型:模仿皮肤科医生进行临床图像中皮肤疾病的准确鉴别诊断
皮肤疾病是最常见的健康问题之一,准确的计算机辅助诊断方法对皮肤科医生和患者都至关重要。然而,大多数现有方法忽视了皮肤疾病诊断所需的基本领域知识。本文提出了一种新型多任务模型,名为DermImitFormer,通过模仿皮肤科医生的诊断程序和策略来填补这一空白。通过多任务学习,该模型同时预测身体部位和病变属性,以及疾病本身,提高了诊断准确性并改善了诊断可解释性。设计的病变选择模块模仿了皮肤科医生的放大动作,有效突出了嘈杂背景中的局部病变特征。原创 2024-05-16 09:53:27 · 356 阅读 · 0 评论 -
HC-Net: 自动牙周疾病诊断的混合分类网络
从全景X射线图像中准确分类牙周病对于临床高效诊疗至关重要,但由于射线照相术中的微妙证据,这是一项具有挑战性的任务。最近的方法试图通过估计图像上的骨质流失来对牙周病进行分类,依赖于放射学手动注释来监督分割或关键点检测。然而,这些射线照相注释与临床金标准不一致,可能导致测量误差和分类不稳定。在本文中,提出了一种新型的混合分类框架HC-Net,用于从X射线图像中准确分类牙周病。该框架由三个部分组成:牙齿水平分类、患者水平分类和可学习的自适应噪声OR门。原创 2024-05-15 09:04:29 · 645 阅读 · 0 评论 -
Towards Novel Class Discovery: A Study in Novel Skin Lesions Clustering
在识别皮肤疾病的皮肤镜图像方面,现有的深度学习模型表现出了令人期待的性能。然而,这些模型在临床应用中只能识别预定义的类别,而无法应对不断涌现的新未知类别的数据。因此,自动发现和识别新的语义类别对于从新数据中获取知识至关重要。为了解决这个问题,研究提出了一种新的自动发现新语义类别的框架,它基于已知类别的知识。具体而言,首先利用对比学习方法学习所有已知和未知类别数据的稳健且无偏的特征表示。然后,采用一种基于不确定性感知的多视图交叉伪监督策略,使用自我标记策略生成的伪标签对所有类别的数据进行联合训练。原创 2024-05-14 09:20:20 · 278 阅读 · 0 评论 -
利用关系感知一致性和虚拟特征补偿解决医学分类中的长尾问题
由于患病样本稀缺,医学图像数据集存在天然的不平衡,导致诊断算法对多数类别产生偏见。这一情况降低了诊断性能,特别是在识别罕见类别方面。现有研究将这一挑战描述为长尾问题,并采取解耦策略来减轻分类器的偏见。但是这些研究仅使用不平衡的数据集来训练编码器,并通过舍弃主要类别的样本来重新训练分类器,从而限制了诊断性能。本文提出了一种分为两个阶段的多视图关系感知一致性和虚拟特征补偿(MRC-VFC)框架。在第一阶段,设计了一种多视图关系感知一致性(MRC)用于表示学习,为编码器的训练提供了无偏的指导,除了不平衡的监督。原创 2024-05-14 08:58:46 · 868 阅读 · 0 评论 -
Automatic Segmentation of Internal Tooth Structure from CBCT Images Using Hierarchical Deep Learning
牙齿的精确分割对于治疗规划至关重要。然而,以往的方法往往将牙齿视为一个整体进行分割,忽略了牙齿内部结构的重要性。本文提出了一种完全自动化的方法,用于分割牙齿的内部结构,包括牙釉质、牙本质和牙髓。这项任务具有挑战性,因为需要从CBCT图像中准确地识别96种不同的牙齿结构。设计了一个包含粗到精分割的三阶段过程,旨在在不降低原始分辨率的情况下实现牙齿内部结构的精确分割。为了有效地捕获牙齿的分层结构,提出了双层次U-Net(DHU-Net),该网络能够有效地融合来自不同层次的编码器和解码器特征。原创 2024-05-11 11:40:16 · 203 阅读 · 0 评论 -
ACC-UNet: A Completely Convolutional UNet Model for the 2020s
这十年以来,计算机视觉领域引入了 Vision Transformer,标志着广泛的计算机视觉发生了根本性的变革。类似的转变也出现在医学影像领域,UNet,作为最具影响力的架构之一,已经重新设计为使用了 Transformer。此外,像 ConvNext 这样的重要工作重新审视了视觉中卷积模型的有效性,将一个 ResNet 提升到了 Swin Transformer 的水平。原创 2024-05-11 11:30:12 · 272 阅读 · 2 评论