·目录
目录
摘要
糖尿病性视网膜病变(DR)是一种常见的导致失明的视网膜疾病。为了诊断的目的,DR图像分级旨在提供自动的DR分级分类,这在传统的二元DR图像分类研究方法中是没有解决的。
眼睛图像中的小物体,如病变和微动脉瘤,对医学成像中的糖尿病分级至关重要,但它们很容易受到其他物体的影响。为了解决这些挑战,我们提出了一种新的深度学习架构,称为BiRA-Net,它结合了特征提取的注意力模型和细粒度分类的双线性模型。
此外,在考虑不同DR类别的不同等级之间的距离时,我们提出了一种新的损失函数,称为分级损失,从而提高了该方法的训练收敛性。实验结果表明,该方法具有优越的性能。
作者想解决的问题:解决DR分级中病变和微血管瘤这种极易受到其他物体影响的小物体的分类。
作者解决问题的理论/模型:①提出了一种新型的深度学习架构,称为BiRA-Net ②提出了一种新的损失函数-分级损失
这个方法的优越性在哪?:①BiRA-Net 结合了特征提取的Attention模型和细粒度分类的双线性模型 ②考虑不同DR类别的不同等级之间的距离,该损失函数提高了方法的训练收敛性
1.引言
DR诊断的主要挑战是,DR是一种没有早期预警信号的无声疾病,这使得及时的诊断是无效的。传统的解决方案是低效的,其中,训练有素的临床医生可以手动检查和评估来自数字Fondus摄影的诊断图像。
这种手段的检测方式根据可见到的医生和病人的人数,需要几天时间。除此之外,这种诊断的结果因医生而异,其准确性在很大程度上依赖于从业者的专业知识。此外,在许多博士领域可能缺乏所需的专业知识和设备。
上述挑战提出了开发自动DR检测系统的必要性。近年来,进行了许多自动检测,重点是特征提取和两类预测。这些作品在某种程度上是有效的,但也有几个缺点。首先,从照片中提取的特征是手工制作的特征,它们对许多条件都很敏感,如噪声、暴露性和伪影。其次,特征定位和分割不能很好地嵌入到整个DR检测框架中。此外,只有通过诊断来确定DR是否存在,而不是诊断其严重程度,并不能很好地解决实际问题,也不能为医生提供有用的信息。
最近,卷积神经网络(CNN)在各种计算机视觉任务中表现出了有吸引力的性能。在本文中,我们采用基于CNN的架构开发了一种五级DR图像分级方法。在所提出的架构中,我们设计了一种更好的特征提取和损失函数,称为分级损失,快速收敛。此外,本文使用双线性策略更好地预测细粒度图像任务。与其他最先进的五类分类研究工作相比,该方法能够获得优越的分类精度性能。本文的贡献总结如下:
①提出了一种新的深度学习架构BiRA-Net来解决DR分级的挑战。它包含了一种为更好的特征学习而设计的注意机制。此外,还采用了双线性训练策略来帮助细粒度视网膜图像的分类。
②提出了一种基于Softmax的新损失函数为了测量细粒度DR分级问题的模型分类精度,并通过实验验证,从而有效地提高了该方法的训练收敛性。
本文的其余部分组织如下。首先,在第2节中提供了对相关工作的简要回顾。然后在第3节中提出了所提出的BiRA-Net,并与第4节中最先进的方法进行了比较。最后,第5节结束了本文。
背景介绍:为什么研究这个课题:传统的检测手段需要大量的知识储备和设备,且耗时过长,对于医生的专业素养要求过高。
研究进行到了哪个阶段:先前的研究有特征提取和两类预测,但是特征提取对于噪声等众多条件敏感,局限性高,