【论文翻译】COMPUTER VISION FOR COVID-19 CONTROL: A SURVEY

论文地址

摘要

COVID-19大流行病在全球的蔓延已经引发了一种迫切的需要,即为抗击对人类人口的巨大威胁作出贡献。计算机视觉作为人工智能的一个分支领域,近年来在解决医疗保健中的各种复杂问题方面取得了成功,并有可能在控制COVID-19方面做出贡献。为了响应这一号召,计算机视觉研究人员正在试用他们的知识库,以设计有效的方法来应对COVID-19的挑战,并为全球社会服务。每天都在分享新的贡献。它促使我们回顾最近的工作,收集有关可用研究资源的信息,并指出未来的研究方向。我们想让计算机视觉研究界能够利用它来节省他们宝贵的时间。本文旨在对计算机视觉对抗COVID-19大流行病的现有文献进行初步综述。

1. INTRODUCTION:

COVOD-19,一种传染性疾病是由严重急性呼吸综合征(SARS-CoV-2)引起的[1]并命名为冠状病毒,是由于其外观(在电子显微镜下)与日冕相似[2]。与COVID 19的斗争促使全世界的研究人员探索、理解、设计新的诊断和治疗技术,并最终将这一威胁推向顶峰。在本文中,我们将讨论计算机视觉社区如何通过提出新的方法或通过提高现有工作的效率和速度来应对这一威胁。计算机视觉是一个跨学科的领域,它研究计算机如何通过解释数字图像中的信息来发展高层次的理解。近年来,由于机器学习的一个分支——深度学习的成功,它取得了长足的进步。计算机视觉技术在各个应用领域,特别是在医疗保健和医学研究领域显示出了巨大的应用前景。在医疗保健应用中存在着大量新的计算机视觉方法,包括但不限于疾病诊断、预后、手术、治疗、医学图像分析和药物发现[5]。这一成功使计算机视觉科学家能够在疾病诊断、预后、预防、控制、治疗和管理等方面作出贡献,作为对抗COVID-19的前线士兵接受挑战。对抗COVID-19的科学反应要快得多,范围也广得多。根据PubMed[6],在2019年,有755篇学术论文发表,其中包括“冠状病毒”一词,但即使仅在2020年的前80天,这一数字也上升到令人震惊的1245篇关于病毒家族的文章。《经济学人》将其称为“时代的科学”,希望这些努力将有助于加快COVOD-19疫苗的研发。

到目前为止,计算机视觉中已经提出了许多方法来处理对抗COVID-19的不同方面。这些方法因其处理以下问题的方式不同而有所不同:医学成像是否有助于更快、更可靠地诊断COVID19?为了追踪?哪些图像特征区分细菌性肺炎与病毒性肺炎与COVID-19肺炎?我们应该如何从疾病幸存者获得的影像学数据中学习筛选危重和非危重患者?如何利用计算机视觉来加强对感染者的社会距离和早期筛查?3D计算机视觉ca如何帮助维持医疗设备供应?三维计算机视觉如何指导COVID-19疫苗的研制?正在寻找这些问题的答案,并已做了初步工作。本次调查的目的是将计算机视觉方法分为大类,并对每一类中具有代表性的方法进行全面的描述。我们希望读者能够理解基线工作,并在其他人离开的地方开始他们的工作。此外,我们的目标是找出新的趋势和想法,以便在我们这个时代的战争中建立一个更强有力和计划周密的战略。

我们的调查还将包括印刷前格式的研究论文,以及由于这种疾病造成的时间紧迫性。它可能是有问题的,因为风险较低的质量和工作没有适当的验证。另外,各种工作还没有投入临床试验,耗时较长。然而,我们在这里的意图是分享来自单一平台的想法,并强调计算机视觉社区的努力。我们希望我们的读者意识到这些当代的挑战。我们采用自下而上的方法来描述需要首先解决的研究问题。因此,我们从疾病诊断入手,探讨疾病预防与控制以及治疗相关的计算机视觉研究工作。第二节通过将计算机视觉研究领域划分为三类来描述计算机视觉研究领域的总体分类,第三节详细描述了每一个研究领域,相关论文和代表性工作的简要描述。第4节提供了可用资源的描述,包括研究数据集、它们的链接、深度学习模型和代码。第5节提供了讨论情况和今后的工作方向,随后是结论性意见和参考文献。

2. HISTORICAL DEVELOPMENT  

新型冠状病毒SARS-CoV-2(以前称为2019 nCoV)是冠状病毒科病毒家族的第七个成员,这些病毒是包膜的、非片段的、阳性的RNA病毒[3]。COVID-19的死亡率低于严重急性呼吸系统综合征(SARS)和中东呼吸系统综合征(MERS)冠状病毒病(SARS-CoV为10%,MERS-CoV为37%),但其传染性强,病例数增长迅速[10]。该病于2019年12月31日在湖北省武汉市首次报道[3],此前已有多例不明原因肺炎病例报告。2020年1月7日,通过对中国医院患者呼吸道样本的深度测序分析,发现了一种新的冠状病毒作为致病微生物[10]。2020年1月30日,疫情被宣布为国际关注的突发公共卫生事件。2020年2月11日,世卫组织宣布了新冠状病毒病的名称:COVID-19。在3月11日世界卫生组织(世卫组织)宣布后,它被正式视为流行病。

3. TAXONOMY OF KEY AREAS OF RESEARCH

在这一节中,我们描述了试图对抗COVID-19威胁的计算机视觉技术的分类。为了方便读者阅读,我们将其分为三个关键研究领域,包括COVID-19:(i)诊断和预后,(ii)疾病预防和控制,以及(iii)疾病治疗和管理。这种分类如图2所示。在下面的小节中,我们将讨论每个研究领域、相关论文以及代表性工作的简要描述。

3.1诊断和预后

这场斗争中的一个重要步骤是可靠、快速和负担得起的诊断过程,这一过程可以随时为国际社会所利用。根据《剑桥字典》[15],诊断是“对疾病或其他问题的确切性质作出判断,特别是在检查后或这样的判断:”而预后是“医生对疾病的可能或预期发展或好转机会的判断”。目前,逆转录酶定量聚合酶链反应(RT-qPCR)被认为是诊断COVID-19的金标准[7]。在这项试验中,从鼻腔拭子中提取少量病毒RNA,进行扩增、量化,并使用荧光染料进行病毒检测。然而,测试是费时且手动的,这限制了它的可用性。一些研究也显示了假阳性的PCR检测[8]。

计算机断层扫描:另一种方法是使用使用计算机断层扫描(CT)成像的放射学检查[9]。胸部CT扫描或胸部CT扫描是一种非侵入性检查,用于获得患者胸部的精确图像。它使用一种增强型的x光技术来提供比标准x光更详细的胸部图像。它产生的图像包括骨骼、脂肪、肌肉和器官,给医生一个更好的视角,这对做出准确的诊断至关重要。

有两种类型的胸部CT扫描,即高分辨率和螺旋CT扫描[16]。高分辨率胸部CT扫描在x射线管的一次旋转中提供了不止一个切片(或图像)。另一方面,胸部螺旋CT扫描利用的是一张桌子,它在x射线管沿着螺旋路径行进的同时,不断地穿过一个隧道状的孔。后者的优点是能够产生肺部的三维图像。

重要的CT特征包括磨玻璃样阴影、实变、网状/增厚的小叶间隔、结节和病变分布(左、右或双侧肺[17-19,36]。在COVID-19肺炎中发现的最明显的CT特征是双侧和胸膜下的毛玻璃混浊区,影响下叶的巩固,在中期(症状出现后4-14天),可能观察到疯狂的铺路模式和晕征[8-111720,36]。一例CT图像如图3所示。由于疾病特征的识别甚至对专业放射科医生来说都是耗时的,在这个阶段,计算机视觉通过自动化的过程来寻求帮助。

3.1.1代表性工作、评价和讨论

迄今为止,提出了各种自动化方法[11-25]。为了讨论计算机视觉在基于CT的疾病诊断中的整体方法和性能,我们选择了一些有代表性的工作,概述了最近的方法的有效性。

第一类工作将诊断作为一个分割问题。陈军等人。[21]提出了一个由46096名健康和感染患者的CT图像数据集,由专业放射科医生标记。收集106例确诊为COVID-19肺炎的患者和55例对照组。本研究使用深度学习模式进行分割,只为在健康及感染病人的电脑断层影像中辨识感兴趣的感染区域。基于UNet++语义分割模型[22]对289幅随机选取的CT图像进行有效区域提取,并在其他600幅随机选取的CT图像中进行测试。

该模型在回顾性数据集中,每例敏感度为100%,特异度为93.55%,准确度为95.24%,阳性预测值为84.62%,阴性预测值为100%;每幅图像敏感度为94.34%,特异度为99.16%,准确度为98.85%,PPV为88.37%,NPV为99.61%。这项研究的训练模式被部署在武汉大学人民医院(中国湖北省武汉市)以加速新COVID-19病例的诊断。它是在互联网上开放的,以便能够快速审查新病例。构建了基于云的开放存取人工智能平台,为全球范围内检测COVID-19肺炎提供支持。为此目的,提供了一个网站,免费访问本模式(http://121.40.75.149/znyx ncov/index)。

第二类工作认为COVID-19是一个二分类问题。Lin Li[39]提出(COVNet),利用RESNET50上的迁移习从胸部体CT中提取视觉特征。采用U-Net模型对肺组织进行分割。它使用了2016年8月至2020年2月从6家医院收集的3322名患者的4356次胸部CT检查。COVID-19的敏感性和特异性分别为90%(127例中114例;p值<0.001),95%可信区间(95%CI:83%,94%)和96%(307例中294例;p值<0.001),95%CI:93%,98%。该模型还可在https://github.com/bkong999/COVNet上在线获取,供公众和研究使用。

诊断问题也被视为三分类任务:区分健康患者与其他类型肺炎患者和COVID-19患者。Song等人在[23]使用了88名诊断为COVID-19的患者、101名感染细菌性肺炎的患者和86名健康人的数据。提出了一种基于ResNet50的关系抽取神经网络(DRE-Net),将特征金字塔网络(FPN)[24]和注意模块相结合,以更细粒度的方式表示图像。在线服务器位于:在线服务器可通过http://biomed.nsccgz.cn/server/Ncov2019使用CT图像进行在线诊断。

由于可用于注释和标记的时间有限,还开发了基于弱监督深度学习的方法,使用3D-CT体积检测COVID-19。

郑传生[25]提出用三维深卷积神经网络(DeCoVNet)从CT体积中检测COVID-19。这种弱监督的深度学习模型可以准确地预测COVID-19在胸部CT体积内的感染概率,而无需对病灶进行标注训练。使用预先训练的UNet分割CT图像。我使用从2019年12月13日到2020年1月23日收集的499个CT卷进行训练,并使用从2020年1月24日到2020年2月6日收集的131个CT卷进行测试。利用概率阈值0.5对COVID阳性和COVID阴性进行分类,得到准确度为0.901,正预测值为0.840,非常高的负预测值为0.982。开发的深度学习模型可在https://github.com/sydney0zq/COVID-19-detection上获得。

不同的方法使用了不同的性能指标。同样,图像和数据集的数量也不同,这使得它们的比较非常困难。一些指标包括准确性、敏感性、特异性、曲线下面积(AUC)、阳性预测值(PPV)、阴性预测值(NPV)、F1评分。方法的准确性决定了预测值的正确性。 Precision决定了测量的再现性或有多少预测是正确的。Recall显示发现了多少正确的结果。F1分数使用精确性和召回率的组合来计算平衡的平均结果。下列方程式说明如何计算这些值,其中TP、TN、FP和FN分别为真阳性、真阴性、假阳性和假阴性。

X射线成像:使用CT成像的缺点是需要较高的患者剂量和增强的成本[42]。数字胸部x线摄影(CXR)因其成本低、适用范围广,成为检测胸部病理的最佳影像学方法。因此,CXR中covid-18特征的自动化诊断将是非常有效的疾病诊断工具。

X射线检查因其成本低、适用范围广、速度快而被认为是最常用的射线检查方法。基于数字X射线图像的计算机辅助诊断用于不同的疾病,包括骨质疏松症[43]、癌症[44]和心脏病[45]。然而,由于在X射线图像中很难区分对比度差的软组织,因此在基于X射线的诊断中,对比度增强[46-47]被用作预处理步骤。为了识别肺结节,胸部X射线的肺部分割是至关重要的重要步骤,文献[48-51]提出了多种分割方法。

在COVID-19感染的患者中,CXR检查显示为实变。在香港的一项研究[52]中,三个不同的患者每天进行CXR检查。两名患者在3-4天内肺实变有进展。随后的CXR显示在随后的两天内有所改善。第三个病人在8天内没有明显的变化。然而,类似的研究表明,在第一次研究的1小时后拍摄的胸片上,CT上右下叶周围的磨玻璃混浊不可见。然而,为了更好地进行放射分析,仍建议与CT一起使用CXR。提出了各种自动化方法(请参阅表2,下一节讨论最突出的工作)。

3.1.2代表性工作、评价和讨论

针对这一问题,提出了基于深度学习的X射线COVID-19计算机视觉模型。最重要的进展之一是加拿大达尔文人工智能提出的Covid网模型[54]。本文将人驱动的原理性网络设计原型技术与机器驱动的设计探索相结合,提出了一种用于胸部X射线COVID-19病例检测的网络结构。第一阶段基于残差结构设计原理的人机协同设计策略。用于训练和评估COVID网的数据集被称为COVIDx[54],由13645例患者的16756张胸片图像组成。COVID-19的准确度为92.4%,灵敏度为80。最初的网络设计原型作出以下三种预测之一:a)无感染(正常),b)非COVID19感染(如病毒、细菌等),c)COVID-19病毒感染。这样做的好处是帮助临床医生根据感染原因更好地决定采用何种治疗策略,因为COVID-19和非COVID19感染需要不同的治疗方案。在第二阶段,数据和特定于人类的设计需求一起,作为设计探索策略的指南,学习和识别最佳的宏架构和微架构设计,从而构建最终定制的深神经网络架构。拟议的COVID Net网络图如图所示,可在https://github.com/lindawangg/COVID-Net上公开获取。

Ezz El-Din Hemdan等人。[55]基于DCNNs的七种不同架构,即VGG19、DenseNet201[56]、InceptionV3、ResNetV2、InceptionResNetV2、Exception和MobileNetV2[57]提出了COVIDX网络。这些模型是根据Joseph Cohen博士和Adrian Rosebrock博士提供的COVID-19病例进行训练的:https://github.com/ieee8023/COVID-chestxray-dataset[58]和f1评分,正常和COVID-19分别为0.89和0.91,在最佳模型组合中报告。同样,Asmaa Abbas等人。[59]分解、转移和合成(DeTraC),用于COVID-19胸部X射线图像的分类,其中使用ImageNet和ResNet上预先训练的模型的CNN特征。数据集包括80个来自日本放射技术学会(JSRT)Cohen JP的正常cxr样本(4020 4892像素)。COVID-19图像数据采集,网址:https://githubcom/ieee8023/COVID chestxray dataset[58]。2020年;该模型的准确率为95.12%(灵敏度为97.91%,特异性为91.87%,精密度为93.36%),代码可在https://github.com/asmaa4may/DeTraC COVId19上获得。

Biraja Ghoshal等人引入了不确定性感知COVID-19分类和推荐模型。[60]提出了基于降权的贝叶斯卷积神经网络(BCNN)。为了使COVID-19检测更有意义,[61]使用了两种深度学习中的预测不确定性。其中一种是认知不确定性或模型不确定性,由于它没有考虑到数据的所有方面或缺乏训练数据,因此导致模型参数的不确定性。另一种是任意不确定性,它解释了由于类重叠、标签噪声、同态和异方差噪声而产生的观测固有噪声,即使要收集更多的数据,这些噪声也无法降低。Bayesian不一致主动学习(BALD)[62]基于互信息,该互信息最大化了模型后验密度函数和预测密度函数之间的互信息,近似为预测分布熵和样本预测平均熵之间的差异。

BCCN使用了来自Joseph Cohen博士Github库的68张COVID-19例肺的后前(PA)X光片进行训练[58],并用来自健康患者的Kaggle胸部X光片(肺炎)增强了数据集。在现有的数据集上达到了88.39%的准确率。这项工作还建议将不同的特征可视化,作为对点预测的额外洞察,以实现更明智的决策过程。它使用各种最新方法生成的显著图,例如类激活图(CAM)[63]、导向反向传播和引导梯度CAM和梯度,以在CSR图像中显示更明显的特征。

3.2防治

世卫组织提供了一些关于感染预防和控制(IPC)策略的指南[70],以便在怀疑感染新型冠状病毒(2019 nCoV)时使用?在医疗环境中限制传播的主要IPC策略包括早期识别和源头控制,对所有患者应用标准预防措施;对COVID-19疑似病例实施经验性附加预防措施,如空气传播预防措施;实施行政控制并使用环境和工程控制。计算机视觉应用为IPC策略的实施提供了有力的支持。

3.2.1代表性工作、评价和讨论

在疾病进展的早期阶段确定的一个策略是使用口罩或防护设备来限制病毒的传播。在一些国家,如中国,将其作为一种控制策略加以实施,并通过基于计算机视觉的系统来促进其实施。王中元等[71]提出了一种基于多粒度蒙面人脸识别模型的蒙面人脸识别方法,在蒙面人脸图像数据集上达到了95%的准确率。该数据集还可用于研究,并提供三种类型的蒙面人脸数据集,包括蒙面人脸检测数据集(MFDD)[72]、真实世界蒙面人脸识别数据集(RMFRD)和模拟蒙面人脸识别数据集(SMFRD)[73]。

红外热像仪也被推荐为感染者的早期检测策略,特别是在像机场乘客这样的乌鸦中。B.B.Lahiri[74]对红外热成像在医学上的应用进行了全面的综述,其中包括发热筛查。sombounkaew A,Prempree P等[75]提出了一种基于前额红外温度的自动发热筛查系统移动平台。Ghassemi P,Pfefer等人[76]讨论了用于发热筛查的红外热像仪标准化性能测试的最佳实践。Negishi T[77]提出了一种基于热成像和CCD摄像机的感染筛查系统,该系统具有良好的稳定性和快速性,可以通过特征匹配和MUSIC算法进行非接触生命体征的检测。此前,对于SARD的传播控制,W.Chiu等人[78]提出了一种有助于发热筛查的计算机视觉系统。它被用于早期的SARS爆发。从2003年4月13日到5月12日,72327名患者或访客通过TMU-WFH唯一允许进入的入口,那里有一个热像仪站正在运行。

由于Al-Naji等人[79]过去曾使用这种系统对灾害管理进行远程生命体征监测,因此建议使用遥感和数字图像的大流行性done来识别感染者。类似的例子是视觉引导机器人控制的三维物体识别和操作。在这个困难时期,3D建模和3D打印机有助于维持医疗设备的供应。Joshua M.Pearce[81]讨论了RepRap类3-D打印机和开源微控制器,通风机的大规模分布式制造有可能克服医疗供应短缺。细菌扫描是对抗CORONA-19战斗的重要步骤。Edouard A.Hay[82]提出了一种卷积神经网络,用于细菌扫描样鉴定细菌光片显微镜图像数据,准确率超过90%。

3.3临床管理和治疗

迄今为止,还没有针对COVID-19引起的疾病的具体治疗方法。然而,许多症状是可以治疗的,因此可以根据患者的临床情况进行治疗。临床管理实践可以改进,例如根据疾病的严重程度对患者进行分类,并为他们提供即时医疗服务。目前,各个小组正在为这种疾病研制疫苗。由于计算机视觉的多学科性质,它支持计算机视觉的发展和临床管理。

3.3.1  Representative Work, Evaluation and Discussion 

这场斗争中的一个重要步骤是临床管理,可以通过识别危重病人来完成,以便他们得到立即的医疗护理或呼吸机支持。[33]建议对不同类型的感染患者进行疾病进展评分。它被称为Corona评分,是通过测量感染面积和疾病的严重程度,从CT图像。Corona评分“测量患者随时间的进展。Corona得分是通过网络激活图的体积和计算的。

图7:通过测量CT图像中的感染区域和疾病严重程度计算的Corona评分。它可以用来识别危重病人,以便他们得到立即的医疗照顾。图像改编自[33]。

同样,Graeme MacLaren[84]也支持放射性证据可以区分危重病人。王云璐[85]利用深度相机和深度学习作为异常呼吸模式分类器,有助于准确、不引人注目地大规模筛查covid-19感染者。呼吸模拟模型(RSM)是为了弥补训练数据量大和真实数据量少的不足而提出的。他们提出了具有双向和注意机制的GRU神经网络(BI-AT-GRU)来分类6种临床上有意义的呼吸模式(呼吸暂停、呼吸急促、呼吸缓慢、生物群、Cheyne-Stokes和中枢性呼吸暂停),以对危重病患者进行分类。该模型能对6种不同的呼吸模式进行分类,准确率、查全率和F1分别为94.5%、94.4%、95.1%和94.8%。这种方法在一个主题和两个主题的情况下工作的演示视频可以在线下载(https://doi.org/10.6084/m9.figshare.11493666.v1)。

CoV尖峰糖蛋白是疫苗、治疗性抗体和诊断的关键靶点。病毒通过三聚体棘突糖蛋白与宿主细胞结合。通过生物物理分析,Daniel Wrapp等人[86]表明,这种蛋白与它们共同的宿主细胞受体结合的紧密程度至少是严重急性呼吸综合征(SARS)冠状病毒相应的棘突蛋白的10倍。这些研究提供了有价值的信息。指导制定2019年nCoV医疗对策的信息。定量结构-活性关系(QSAR)分析在药物发现和毒理学方面具有广阔的前景[87],它利用从分子几何学计算的结构、量子化学和物理化学特征作为预测生理活性的解释变量。通过将360°的分子构象图像融入到深度学习中,深度特征表示学习可以用于QSAR分析。Yoshihiro Uesaw a[88]提出了基于新型分子图像输入技术的深度学习QSAR(Quantitative structure–activity relationship)分析。这样的图热尼可以用于药物的发现,也可以为疫苗的开发铺平道路。

4-数据集和资源

CT数据集:

COVID-CT数据集[89]:圣迭戈大学发布了一个数据集COVID-CT数据集-有349张包含COVID-19临床发现的CT图像,声称是同类中最大的。为了证明其潜力,他们训练了一个人工智能模型,使其精度达到85%。网址:https://github.com/UCSD-AI4H/COVID-CT。下面给出了一些示例图像:

X射线图像数据集:

COVID-19放射照相数据库[90]:来自卡塔尔大学、多哈、卡塔尔和达卡大学的研究团队,孟加拉国及其巴基斯坦和马来西亚的合作者与医生合作,为COVID-19阳性病例建立了一个胸部X射线图像数据库,并提供了正常和病毒性肺炎图像。在我们目前的版本中,有219个COVID-19阳性图像,1341个正常图像和1345个病毒性肺炎图像。我们将继续更新这个数据库,一旦我们有新的x射线图像为COVID-19肺炎患者。用于Matlab代码和训练模型的GitHub链接:https://GitHub.com/tawsifur/COVID-19-Chest-Xray-Detection

研究小组成功地对COVID-19、病毒性肺炎和正常胸部X线图像进行了分类,准确率为98.3%。这项学术工作提交给科学报告(自然)和手稿上传到arvix服务器。请确保您在使用数据集、代码和经过培训的模型时给予我们信任。

COVID-19图像数据收集[58]:Joseph Paul Cohen提供了初始COVID-19开放图像数据收集。所有图像和数据都在以下URL下发布:https://github.com/ieee8023/covid-chestxray-dataset。

COVIDx数据集[53]:该数据集发布了全新的COVIDx数据集,包括13645例患者的16756张胸片图像。当前的COVIDx数据集由以下开源胸片数据集构建:https://github.com/ieee8023/covid-chestxraydataset:https://www.kaggle.com/c/rsna-pneumonia-detection-challenge它是由北美放射学会和其他参与rsna肺炎检测的人员提供的数据的组合Challenge和Joseph Paul Cohen博士以及MILA的团队参与了COVID-19图像数据收集项目,为全球社区提供数据。

ChestX-ray8[91]:胸片是筛查和诊断多种肺部疾病最常用的放射学检查之一。许多现代医院的图片存档和通讯系统(PACS)中积累和储存了大量的X射线成像研究和放射报告,可在以下网址获得:https://nihcc.app.box.com/v/ChestXray-nihcc。

蒙面人脸识别数据集

[71]:介绍了三种类型的蒙面人脸数据集,包括蒙面人脸检测数据集(MFDD)、真实蒙面人脸识别数据集(RMFRD)和模拟蒙面人脸识别数据集(SMFRD),MFDD数据集可用于训练精确的蒙面人脸检测模型,用于后续的蒙面人脸识别任务。RMFRD数据集包括525名戴口罩者的5000张照片,以及相同的525名不戴口罩者的90000张照片。据我们所知,这是目前世界上最大的真实蒙面人脸数据集。SMFRD:一个模拟的蒙面人脸数据集,覆盖10000名受试者的500000张人脸图像。这些数据集位于:https://github.com/Xzhangyang/Real-World-Masked-Face-Dataset。

Thermal Images  Datasets:

没有用于高热筛查的热数据集。然而,Marcin Kopaczka[92]提出了一个完全注释的热面孔数据库及其在热面孔表情识别中的应用。使用这些系统可以进一步了解相关数据:https://www.flir.com.au/discover/public-safety/thermal-imaging-for-detection-highted-bodytemperature/

5-结束语:

本文对计算机视觉对抗COVID-19挑战的努力和方法进行了广泛的综述,并对目前具有代表性的工作进行了简要的回顾。根据这些方法在疾病控制中的作用,我们将其分为三类。我们提供了初步代表性工作的详细总结,包括有助于进一步研究和开发的可用资源。我们相信,本文首次对COVID-19控制的计算机视觉方法进行了综述,它具有丰富的参考文献内容,可以对这一领域提供有价值的见解,并鼓励新的研究。然而,这项工作可以看作是一个早期的回顾,各种计算机视觉方法正在被提出和测试,以控制COVID-19大流行。我们相信,这些努力将不仅在疫情期间,而且在后COVID-19环境中产生深远的影响和后果。

6-参考文献:

省略

为便于查看,特制作了一个脑图:

 

Capsule Networks for Computer Vision: A Survey 胶囊网络在计算机视觉中的应用:一篇综述 Abstract: 摘要: Capsule Networks (CapsNets)是一种新颖的深度神经网络架构,旨在克服传统卷积神经网络(CNNs)的一些限制,例如旋转不变性和视角不变性。Capsule Networks使用胶囊来表示图像或对象的各个特征,并且能够学习对象的姿态和空间关系。本文旨在提供对Capsule Networks的综述,重点介绍其在计算机视觉中的应用。我们首先介绍了Capsule Networks的基本原理和结构,并讨论了其与CNNs的区别。然后,我们概述了Capsule Networks在图像分类、目标检测、语义分割和图像生成等任务中的应用。接下来,我们总结了当前在Capsule Networks领域的最新研究进展,并讨论了该领域未来的发展方向。 Capsule Networks (CapsNets) are a novel deep neural network architecture aimed at overcoming some of the limitations of traditional Convolutional Neural Networks (CNNs), such as rotational and viewpoint invariance. Capsule Networks use capsules to represent various features of an image or object and are capable of learning the pose and spatial relationships of objects. This paper aims to provide a survey of Capsule Networks, with a focus on their applications in computer vision. We first introduce the basic principles and structure of Capsule Networks and discuss their differences with CNNs. Then, we outline the applications of Capsule Networks in tasks such as image classification, object detection, semantic segmentation, and image generation. Next, we summarize the latest research developments in the field of Capsule Networks and discuss future directions in this field.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值