【文献翻译】Prediction of Seizure Recurrence. A Note of Caution

记录一下第一遍机翻+稍作修改的结果,之后重新回头润色

最近,在记录机器学习程序可以预测癫痫患者癫痫发作的情况方面取得了重大进展。随着这一进展,出现了一些在我们看来有点为时过早的主张。我们预计许多人将从癫痫预测中受益。我们也怀疑所有人都会受益。尽管机器学习是帮助发现的有用工具,但我们相信,最大的进步将来自于对癫痫发作、癫痫以及癫痫预测的脑电图特征的更深入理解。在这篇文章中,我们列出了乐观和怀疑的理由。


引言

在2016年癫痫基金会对癫痫患者的研究项目调查中,“不可预测性被选为无论发作频率或严重程度的首要问题”(1)。癫痫的复发可能会严重限制(如禁止驾驶),(2)社会破坏性和污名化(3),甚至危及生命(4)。癫痫发作预测有可能改善癫痫管理,从而改善癫痫患者的生活质量(5)。

基于电图特征的方法能够成功预测即将到来的癫痫发作,并可能通过“反应性神经刺激”(RNS)进行干预(6-8),可以替代药物减少癫痫复发。当“pro ictal”(9,10)或“pre-ictal state”(11,12)被确定时,这种治疗模式提供旨在中断癫痫发作的高度局部刺激。确定癫痫易感性的强弱可能对患者有益,因为这样的状态可能允许紧急护理和干预。

我们对癫痫发作发展和传播的理解的进展(13)将使我们期待“有可能为更广泛的患者提供癫痫发作预测”(14)。我们不太确定。在我们解释为什么我们预计短期内只能取得有限的成功之前,我们先简要回顾一下癫痫预测和难治性癫痫的潜在电子干预的新进展。

临床医生和患者早就知道,一些癫痫发作可以在警告信号或症状之前出现(15)。总的来说,只有大约四分之一的全发性癫痫患者承认有先兆(15)。

通过直接放置在大脑暴露表面的电极进行记录的皮层电成像(ECoG)似乎是收集所有信息的最佳方法,用于外科手术切除癫痫病灶(16)。ECoG信号与脑电图信号在物理上是相同的。由于它们直接放置在皮层上,污染信号的噪音更少,电极可以更紧密地间隔。另外,来自ECoG的原始数据可能被输入机器学习算法,与EEG数据相同。头皮电极现在似乎可以预测癫痫复发(17-31)。然而,“与局部电生理异常相关的适度结果提示…我们对神经生理生物标记物与病理生理之间关系的理解存在根本性的差距”(32)。

癫痫预测算法可以用多种方式表征。一种观点是考虑三个独立的方面或轴:(1)要测量的生理信号,如脑电活动或心率;(2)信号处理方法,计算各种信号特征;(3)机器学习方法,将信号特征作为输入,并试图找到特征模式,以区分癫痫活动和非癫痫活动。信号特征和机器学习算法的进展继续快速推进,有助于改进癫痫预测。与癫痫发作相关的信号特征似乎是病人特有的。因此,机器学习算法需要很长一段时间内许多癫痫发作的信号特征才能有价值(33)。脑电图对脑电活动的测量仍然是与癫痫发作相关的最常见的生理测量方法,但基于心功能、皮肤反应或运动的其他测量方法也被使用(34)。



了解癫痫的产生、抑制和传播的背景

在接下来的几段中,我们回顾了癫痫产生和传播的一些元素,这可能有助于理解癫痫的电图相关性。


致痫区(Epileptogenic Zone)

致痫区(EZ)是重复定义为产生癫痫不可缺少的大脑区域(35)。在局灶性癫痫患者中,超过90%的癫痫发作在发作灶有放电,而在其他部位没有(36)。然而,在一些患者中,完全切除假定的EZ并不能抑制癫痫发作(37)。这些病人的术后记录表明,在切除区域的附近也会触发癫痫发作。“潜在癫痫发作区”的概念就这样诞生了(37)。

更深层次的灰色结构(如丘脑网状核)似乎可以调节其他癫痫现象的发生和传播(如2-4 Hz的癫痫峰值波放电)(38)。此外,药物耐药癫痫发作患者的致痫区域可能比药物更易控制癫痫发作的患者更大(39)。


癫痫发作的传播和网络

癫痫发作的产生只是一个开始。“当同步连接的神经元群与周围癫痫网络中快速改变的非同步关系协同工作时”,癫痫发作就会传播(40)。抑制和传播之间的平衡,以及在一定程度上潜在的结构和功能连接,将决定癫痫在多大程度上扩散或不扩散(41)。一种癫痫发作模式的特征是超同步和进行性抑制损害导致癫痫发作传播(42)。

目前癫痫发作是由记录的区域和信号来定义的。随着这些识别的改进,癫痫发作的定义和检测也将得到改进。例如重症监护患者,皮质内深度电极检测到的癫痫发作的百分比远高于表面脑电图(43)。因此,更高的空间分辨率和对额外信号特征的评估有可能影响我们对癫痫发作的感知。因此,癫痫发作的预测取决于我们对癫痫发作的定义,随着检测技术的改进,这种定义可能会改变

皮层中的神经元间活动可以抑制癫痫样活动的扩散(44)。正如预期的那样,当局部抑制网络有缺陷时,癫痫发作传播会增强(45)。

尽管许多关于脑功能连接的报告都假设了“时间稳定性”(即不随时间变化),但脑网络确实会在内部和外部刺激下几乎连续地重组,导致网络内部和网络之间的功能连接在多个时间尺度上出现波动(46,47)。通过“协调癫痫网络中大脑各区域之间的兴奋性”,网络之间或网络之间功能连接的改变不仅允许癫痫发作活动的传播,而且可能“增强癫痫发作的启动、进化和终止”(32)。一些癫痫症特征的结构和功能连通性的普遍干扰也可能导致治疗耐药性(48)。

癫痫被认为是一种神经网络组织紊乱(49)。网络科学的研究表明,网络结构的微小变化会对网络功能产生非常大的影响,正如初始条件的微小变化会对时间序列产生很大的影响一样(50)。这表明对非癫痫神经网络的微小改变可能就是使大脑癫痫所需要的一切。类似地,仅仅是右脑区域的微小变化可能就是减少癫痫发作所需要的全部。尽管这一点尚未在人类身上得到证实,但测量皮质功能网络的工具现在是可用的(51)。

癫痫患者局部连通性的信号变异性明显高于健康对照组(52),这使得皮质神经元的兴奋性往往更接近癫痫发作的临界点。虽然癫痫发作开始(Seizure onset 怎么翻译?)区网络连通性在发作间期可以增强(32,53),但发作电图模式似乎是由不同于维持发作间期电位的网络机制产生的(54)。即使是短暂的局灶性峰值也能激活弥漫性远端网络(55),支持癫痫作为网络疾病的特征。


Electrographic Correlates/Patterns /Signatures of Seizures

在三分之一诊断为耐药性局灶性癫痫的患者中,80 - 120hz的快速活动伴随着非常缓慢的瞬态极化移,以及电压降低似乎是细胞生成的优秀生物标志物和致痫区边界的可靠指标(58)。高的共病率可能反映了外科手术中选择疑似single-seizure focus患者的限制性标准。其他人发现离散频带的频谱功率,以及时域和/或频域通道间关联是有帮助的(14,59)。

还有一些癫痫发作模式的特征是背景活动的去同步化和快速低压节律的出现(41,42),而过度的同步化则与癫痫发作的终止相关(60)。癫痫发作的进化路径在不同的患者之间似乎存在差异,并且倾向于对每个个体都具有刻板印象(11,13,61)。因此,为了预测的目的,发作电信号需要针对每个人的每种发作类型(5,14,17,20,23,25,31,56,62-72)进行个性化处理。流行词是“患者特异性”。也许“大数据”应该是另一个流行词,因为需要对大样本量和多个个体变量进行分析,以决定是否可以将具有类似癫痫类型和其他生理或人口状况的患者群体视为一个(相对同类的)群体。


混沌与混沌系统

不同于它在普通用语中的意思,“混沌”并不意味着随机,而只是实际上不可预测。即使系统的当前状态几乎可以无限精确地知道,最小的误差或扰动限制了我们预测系统未来状态的能力。

癫痫通常是令人吃惊的。这种明显的不可预测性可能反映了纯粹的随机现象,或随时可能出现的突发混乱现象。如果癫痫发作是随机的,那么在癫痫发作前的变化开始出现之前,大多数情况下可能无法预测。如果癫痫发作是突发的混沌现象,癫痫发作预测应该是可能的,因为混沌系统是确定性的。然而,系统的混沌特性限制了癫痫发作前预测的时间

非线性(或混沌)系统由可以以复杂方式交互的成分组成,即使这些部件本身具有简单的动力学或行为。非线性系统的特征是对初始条件、紧急现象、成分之间的自发顺序或同步、自适应和反馈回路(定义如下)的敏感依赖,所有这些都是由部件之间复杂的相互作用产生的。癫痫的脑电图表现为非线性(73,74),可能反映了大脑的非线性动力学

涌现(Emergence)被定义为“在复杂系统的自组织过程中出现新颖的、连贯的结构、模式和属性”(75)。这种“自组织”过程由混沌系统中出现的部件之间的自适应行为组成,导致相对稳定的配置数量有限(76)。非癫痫的大脑是稳定的,不容易进入发作状态。它表现出一种被称为癫痫发作“动态阻力”的特性,这是指一种对过渡到癫痫发作状态的阻力(77)。弹性,一种类似的动态特性,描述了系统在内部错误或外部环境条件出现时保持正常功能的能力(78)。癫痫患者的大脑可能会减少动态抵抗和/或恢复力,导致“多稳态动力学”(79),这意味着它可能会自发地自我组织进入稳定的发作状态(80,81)。基于脑电图通道同步或相干性(振幅同步)的动态网络也可以将广泛性癫痫患者与正常对照组区分开来(82)。

蝴蝶效应证明了对初始条件的敏感依赖。在高度非线性的大气系统中,一只蝴蝶产生的一个小扰动可以在未来的某个时间导致大的变化,甚至可能导致飓风。简而言之,非线性系统的状态在某一时刻的任意小的变化可以在以后产生很大的影响。这就是使确定性非线性系统实际上不可预测的原因。目前还不清楚癫痫发作(相对于潜在的神经脉冲活动)是遵循一个确定性的、混乱的模式,还是仅仅是一个纯粹的随机过程(83,84)

没有人负责大多数大城市的食品分配,但食品还是得到了分配。复杂系统的这种特性被认为是自发秩序,这可能代表了在发作间静息状态期间发生的事情(85)。另一种观点是,发作状态和发作间状态分别代表动力系统的一个稳定或半稳定吸引子状态。癫痫病人的大脑在这些状态之间的转换相对容易,而在非癫痫病人的大脑中,这种相变很难诱导。

神经连接、信息传递和处理是大脑的基本功能,它们可能会被大规模地改变,从而让大脑切换到病理状态,比如癫痫,表明正常生理功能和电活动病理扩散之间存在一个尺度依赖的临界点(临界值)(86)。然而,如果大脑的神经结构接近一个临界点,神经网络结构的微小变化可能会使大脑进入一个不稳定的状态,癫痫发作可能会自发发生。这种对微小变化的空间敏感性已经在网络中描述过(87)。


Pre-ictal

如果癫痫预测在临床上变得有用,那么分析脑电活动的程序需要在癫痫发作前尽可能早、可靠地识别发作前的状态。目前,我们还不知道前兆状态何时开始。知道发作前状态何时开始将允许评估检测和中断即将发生的发作所需的时间。

事件的动态模型定义了不同的阶段转换(有些有事件或特征,有些没有),然后对从一种状态转换到另一种状态的概率建模(88-91)。研究癫痫发作预测算法的人至少能识别出三种状态:(1) a seizure (ictal) state, (2) a pre- or pro-ictal state, and (3) all others。机器学习程序的任务是比较癫痫发作前不同时间间隔的电图特征,以及癫痫发作后较远时间(在时间上)的电图特征。我们的目标是定义一种前兆状态。为了有效地做到这一点,机器学习程序需要提供大量的脑电图记录(92),而这些记录正变得越来越容易获得。


Characteristics of Ictal EEG

一组研究人员发现,在癫痫发作前几个小时,“网络状态变得不那么可变(退化),这一阶段之后是一个整体的功能连接减少”(93)。还有一些人报告说癫痫发作前“更少的混沌”(94,95)或“增加同步”(18,96)。一组研究人员发现在癫痫发作前,发作前放电的振幅随着放电间隔的逐渐减少而逐渐增加(97),而其他组发现累积能量谱(98),或光谱熵、光谱能量和信号能量的测量可以帮助识别发作前状态(17)。还有一些人强调最好的鉴别器为每个个体来说都不同的(99),另一组强调多个的同现现象在高钾海马切片模型(神经网络弹性的损失在临界慢化的设置,减少网络从扰动恢复能力,高频快速活动增加,刺激恢复力依次下降(100)。


Timing

我们的目标是能够在癫痫发作前充分地识别出增加的发作倾向。确定即将发生癫痫发作的可能性和发生癫痫发作的时间间隔变化很大,从不到10秒(17、23、24、72、81、101、102)到一小时或更长时间(20-22、36、93、103)。


Periodicity

犬(104)和人(5,105 - 109)的癫痫发作可以表现出多种类型的周期性(如昼夜节律、多天、每周)。因为只有一些人的癫痫发作具有明显的周期性,所以癫痫发作的预测最好被看作是患者特异性的(5)。致痫性水平的变化(状态转变)(110,111)最有可能表现出周期性,最好被看作是癫痫发作预测的有用信息(112)。这些周期在多大程度上反映了高频振荡(112)、脑电图尖峰电位(112)、大脑连接和抑制神经元(113)的变化仍有待量化。癫痫预测算法最有可能是有效的,当他们包括所有的变量,提供相关的鉴别信息的患者。每个人的发病周期,一旦量化,可能就在那些鉴别信息中。


Warning Signals Before Critical Transitions

在大灾难(例如,物种灭绝、大流行病)之前存在的预警信号(114-117)支持了这样一种概念,即从稳定的条件逐渐过渡到不稳定的条件可能达到一个临界点,预示着过渡的不可逆转(118)。混沌系统中的相变可以逐渐发生,也可以突然发生,这取决于系统(119)。事实上,从非癫痫状态到癫痫活动的相对早期的过渡可以是渐进的(54,120,121)和广泛的(36)。“典型应用的早期预警指标是否适合用于识别更高的癫痫发作概率仍然存在争议”(122,123)。


Binary Forecast or Probability Estimate of Seizure Risk

癫痫发作检测系统可以提供二进制预测(即将癫痫发作:是/否),或提供即将癫痫发作的估计概率的预测(91,124)。概率预测,虽然明显比二进制预测信息更丰富,但在编写算法以启动反应性神经刺激时,可能会降级为二进制预测(8)。即使是仅使用患者报告的癫痫数据的二进制预测系统(高风险和低风险),在50名患者中,正确预测了大约一半的癫痫发作(125)。


Relatively Reliable Prediction

在一场国际众包竞赛中,根据16个硬膜下电极(14个)连续442天的颅内脑电图记录,478个团队提交的10,000多个算法中,相当多的算法能够“区分10分钟发作间期和发作前的数据片段”。这些结果促使作者得出结论,“与临床相关的癫痫预测在更广泛的患者中是可能的,比之前认为的可能。”虽然这些结果很有希望,但仅限于3名患者。如前所述,不同的患者或不同的癫痫类型,发作前的时间周期可能不同,从几秒到一小时或更长。需要更大的患者样本人群来确定癫痫发作前预测的极限。作为这一方向的第一步,对颅内脑电图的众包分析继续在相关平台上进行,如epilepsyecosystem.org(14,126)。


Not so Reliable Prediction

尽管随后表现出热情(12,31,92,127,128),其他人发现三分之一的局灶性(129)或多灶性(130)癫痫患者的脑电图不能为即将发生的癫痫发作提供足够的预测信息。这些发现促使我们对预测癫痫发作和有效干预预防癫痫发作的预期能力提出警告。我们承认,一些(或许是很多)癫痫患者将从预测癫痫复发的机器学习程序中受益,我们也想证明克制自己的热情是有道理的。我们这样做是基于以下考虑。


Prediction Performance Metrics

系统参数的规范,如预测周期、预测水平和导致癫痫发作的数据驱动(无癫痫发作期的最短时间),每个都会影响预测性能指标(131)。因此,研究人员有机会挑选系统参数,将可变地最大化他们的度量。为了尽量减少这种情况,一组人提出了一个测试指标,在给定相同比例的警告时间下,算法灵敏度和机会灵敏度(chance sensitivity)之间的差异(132)。

预测性能指标可能包括敏感性(Sensitivity)和特异性(Specificity)指标(59)敏感性(Sensitivity)定义为准确预测癫痫发作总次数除以记录的癫痫发作总次数。特异性(Specificity)是指正确识别的非事件的数量,由于在大多数时间间隔内癫痫发作事件的数量相对较少,因此通常较难评估(133)。与特异性相关的性能指标包括警告时间(系统做出正面预测的时间的分数)和误报错误率(8,132)。

总结敏感性和特异性之间权衡的一种更普遍的性能衡量方法是受试者工作特征曲线(ROC)下的面积(AUC),它区分发作间和发作前数据,是许多对多种癫痫预测算法进行基准研究的首选衡量方法(59,132,134)。ROC曲线是不同模型参数的真阳性率(TPR)或敏感性与假阳性率(FPR)或1-特异性的曲线。因此,ROC曲线下的面积(AUC)是一种衡量敏感性和特异性之间的相对权衡的方法。这两者对于预测算法的实用性都是必需的。例如,如果特异性完全被牺牲,那么完美的灵敏度总是可能的:总是预测一次癫痫发作,每次癫痫发作都将被准确预测,100%的时间。同样,总是预测“没有发作”也不会错误地预测发作,因此具有完美的特异性。显然,这两种极端都没有用。优化灵敏度(预测所有癫痫发作)和特异性(无误报)是理想的。AUC是这种最佳平衡(135)的度量。

由于评估统计模型存在过拟合(136)的潜在问题,研究者现在寻求测量““optimism corrected AUC”,它通过重复交叉验证(137-139)或保留对出交叉验证(140)来纠正/避免optimism。

这一主题的变体或扩展包括最终的“Improvement over Chance”二元度量,将测量的AUC与““chance-level AUC”进行比较(141),基于ROC曲线的准确率(142),以及推断最显著的癫痫复发预测因子的ROC分析(143)。

评估预测算法准确性的另一种潜在方法是将其准确性与使用具有真实数据某些属性的代理输出数据获得的准确性进行比较。这方面的一个例子是随机置换或洗牌结果标签,从而保留相同数量的正面和负面的原始结果。(144)。在排列标签后,计算预测的准确性,包括敏感性和特异性。在蒙特卡罗风格的模拟中,这个过程被重复多次,所有代理试验的准确性被积累起来,以确定通过随机机会获得真实标签的预测准确性的可能性有多大。由于尚不清楚的原因,这种可用于估计获得选定AUC(145)的概率的蒙特卡罗模拟(146-148)使用的频率较低。



讨论

Butterfly Effect/Important Data Missing

蝴蝶效应是指非线性系统在给定启动时间对测量精度的敏感依赖关系。非线性系统未来状态的预测受到蝴蝶效应的限制。例如,即使所有的确切物理大气动力学方程,预测未来几天天气多受限于目前的天气状况如何准确地诊断可以测量每个位置从地球表面到低层大气。如果神经功能是一个非线性系统,那么癫痫预测可能会受到蝴蝶效应的限制。

蝴蝶效应是由最轻微的测量不精确引起的。这与缺乏有关癫痫发作生成的所有重要过程的信息或缺乏数据不同。我们倾向于使用“missingness”一词(149,150)来描述缺乏关于癫痫发作和传播过程的测量数据。

只有当可识别的发作前信号出现得足够清楚和足够早,从而能够构建预测模型时,癫痫发作预测才能够成功干预。对信号处理和预测算法的许多应用的一些回顾表明了这一努力的巨大广度(151-154)。这种方法已经开始应用于癫痫预测(155,156),认识到深度学习方法所需的原始脑电图数据量可能非常大(157)。


One Size Does Not Fit All

为一个人创建的算法不太可能预测另一个人的癫痫复发(5,11,13,14,17,20,23,25,31,56,61-72)。另一个潜在的问题是,虽然癫痫发作的预测是特定的癫痫或发作类型,但预测可以由无数的患者特征决定。大量的患者数据,以及正确使用的机器学习算法,可能需要确定应用癫痫预测的最佳方法,以获得最佳的患者利益。来自许多患者的足够数量的数据可能会提高患者独立算法的能力,为患者和他们的医生带来好处,他们强烈希望不用等待一年才能从可穿戴设备的预测能力中获益。然而,很明显,癫痫预测算法可以从患者的特定模式中学习,并在从几天到几个月的时间尺度上得到改善(158-160)。

癫痫预测领域的成功很大程度上要归功于那些调查人员,他们创建了一个有价值的数据库,使其公开,并要求其他人为这种数据共享文化做出贡献(161)。存在许多带注释的癫痫发作数据库。一些比较出名的可以在这些参考文献中进一步探索:(71,125,161-165)。

使用机器学习算法的研究经常受到阻碍,因为缺乏标准来允许来自不同数据库的数据被聚合(166)。显然,缺乏足够数量的公开数据(154)。由于可用的人类数据不足(59),最近Kaggle的癫痫预测机器学习竞赛依赖于犬的脑电图数据。如果癫痫研究界能够像基因组学界为人类基因组计划(167)所做的那样合作创建一个共同的、聚合的、公开可用的数据资源,癫痫预测方面的进展将会得到加强。

我们谨慎乐观地认为,许多人将受益于预测癫痫复发的能力。然而,我们确实希望缓和这种乐观情绪,即这种能力将适用于几乎所有患者和所有癫痫发作。我们需要非常大的癫痫发作数据集,加上适当的临床注释和机器学习算法,以及对癫痫发作和癫痫发作的动力学和神经生理学的更深入理解,从而更清楚地了解癫痫发作预测的局限性和可能性。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1 目标检测的定义 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。 目标检测任务可分为两个关键的子任务,目标定位和目标分类。首先检测图像中目标的位置(目标定位),然后给出每个目标的具体类别(目标分类)。输出结果是一个边界框(称为Bounding-box,一般形式为(x1,y1,x2,y2),表示框的左上角坐标和右下角坐标),一个置信度分数(Confidence Score),表示边界框中是否包含检测对象的概率和各个类别的概率(首先得到类别概率,经过Softmax可得到类别标签)。 1.1 Two stage方法 目前主流的基于深度学习的目标检测算法主要分为两类:Two stage和One stage。Two stage方法将目标检测过程分为两个阶段。第一个阶段是 Region Proposal 生成阶段,主要用于生成潜在的目标候选框(Bounding-box proposals)。这个阶段通常使用卷积神经网络(CNN)从输入图像中提取特征,然后通过一些技巧(如选择性搜索)来生成候选框。第二个阶段是分类和位置精修阶段,将第一个阶段生成的候选框输入到另一个 CNN 中进行分类,并根据分类结果对候选框的位置进行微调。Two stage 方法的优点是准确度较高,缺点是速度相对较慢。 常见Tow stage目标检测算法有:R-CNN系列、SPPNet等。 1.2 One stage方法 One stage方法直接利用模型提取特征值,并利用这些特征值进行目标的分类和定位,不需要生成Region Proposal。这种方法的优点是速度快,因为省略了Region Proposal生成的过程。One stage方法的缺点是准确度相对较低,因为它没有对潜在的目标进行预先筛选。 常见的One stage目标检测算法有:YOLO系列、SSD系列和RetinaNet等。 2 常见名词解释 2.1 NMS(Non-Maximum Suppression) 目标检测模型一般会给出目标的多个预测边界框,对成百上千的预测边界框都进行调整肯定是不可行的,需要对这些结果先进行一个大体的挑选。NMS称为非极大值抑制,作用是从众多预测边界框中挑选出最具代表性的结果,这样可以加快算法效率,其主要流程如下: 设定一个置信度分数阈值,将置信度分数小于阈值的直接过滤掉 将剩下框的置信度分数从大到小排序,选中值最大的框 遍历其余的框,如果和当前框的重叠面积(IOU)大于设定的阈值(一般为0.7),就将框删除(超过设定阈值,认为两个框的里面的物体属于同一个类别) 从未处理的框中继续选一个置信度分数最大的,重复上述过程,直至所有框处理完毕 2.2 IoU(Intersection over Union) 定义了两个边界框的重叠度,当预测边界框和真实边界框差异很小时,或重叠度很大时,表示模型产生的预测边界框很准确。边界框A、B的IOU计算公式为: 2.3 mAP(mean Average Precision) mAP即均值平均精度,是评估目标检测模型效果的最重要指标,这个值介于0到1之间,且越大越好。mAP是AP(Average Precision)的平均值,那么首先需要了解AP的概念。想要了解AP的概念,还要首先了解目标检测中Precision和Recall的概念。 首先我们设置置信度阈值(Confidence Threshold)和IoU阈值(一般设置为0.5,也会衡量0.75以及0.9的mAP值): 当一个预测边界框被认为是True Positive(TP)时,需要同时满足下面三个条件: Confidence Score > Confidence Threshold 预测类别匹配真实值(Ground truth)的类别 预测边界框的IoU大于设定的IoU阈值 不满足条件2或条件3,则认为是False Positive(FP)。当对应同一个真值有多个预测结果时,只有最高置信度分数的预测结果被认为是True Positive,其余被认为是False Positive。 Precision和Recall的概念如下图所示: Precision表示TP与预测边界框数量的比值 Recall表示TP与真实边界框数量的比值 改变不同的置信度阈值,可以获得多组Precision和Recall,Recall放X轴,Precision放Y轴,可以画出一个Precision-Recall曲线,简称P-R
1 目标检测的定义 目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。 目标检测任务可分为两个关键的子任务,目标定位和目标分类。首先检测图像中目标的位置(目标定位),然后给出每个目标的具体类别(目标分类)。输出结果是一个边界框(称为Bounding-box,一般形式为(x1,y1,x2,y2),表示框的左上角坐标和右下角坐标),一个置信度分数(Confidence Score),表示边界框中是否包含检测对象的概率和各个类别的概率(首先得到类别概率,经过Softmax可得到类别标签)。 1.1 Two stage方法 目前主流的基于深度学习的目标检测算法主要分为两类:Two stage和One stage。Two stage方法将目标检测过程分为两个阶段。第一个阶段是 Region Proposal 生成阶段,主要用于生成潜在的目标候选框(Bounding-box proposals)。这个阶段通常使用卷积神经网络(CNN)从输入图像中提取特征,然后通过一些技巧(如选择性搜索)来生成候选框。第二个阶段是分类和位置精修阶段,将第一个阶段生成的候选框输入到另一个 CNN 中进行分类,并根据分类结果对候选框的位置进行微调。Two stage 方法的优点是准确度较高,缺点是速度相对较慢。 常见Tow stage目标检测算法有:R-CNN系列、SPPNet等。 1.2 One stage方法 One stage方法直接利用模型提取特征值,并利用这些特征值进行目标的分类和定位,不需要生成Region Proposal。这种方法的优点是速度快,因为省略了Region Proposal生成的过程。One stage方法的缺点是准确度相对较低,因为它没有对潜在的目标进行预先筛选。 常见的One stage目标检测算法有:YOLO系列、SSD系列和RetinaNet等。 2 常见名词解释 2.1 NMS(Non-Maximum Suppression) 目标检测模型一般会给出目标的多个预测边界框,对成百上千的预测边界框都进行调整肯定是不可行的,需要对这些结果先进行一个大体的挑选。NMS称为非极大值抑制,作用是从众多预测边界框中挑选出最具代表性的结果,这样可以加快算法效率,其主要流程如下: 设定一个置信度分数阈值,将置信度分数小于阈值的直接过滤掉 将剩下框的置信度分数从大到小排序,选中值最大的框 遍历其余的框,如果和当前框的重叠面积(IOU)大于设定的阈值(一般为0.7),就将框删除(超过设定阈值,认为两个框的里面的物体属于同一个类别) 从未处理的框中继续选一个置信度分数最大的,重复上述过程,直至所有框处理完毕 2.2 IoU(Intersection over Union) 定义了两个边界框的重叠度,当预测边界框和真实边界框差异很小时,或重叠度很大时,表示模型产生的预测边界框很准确。边界框A、B的IOU计算公式为: 2.3 mAP(mean Average Precision) mAP即均值平均精度,是评估目标检测模型效果的最重要指标,这个值介于0到1之间,且越大越好。mAP是AP(Average Precision)的平均值,那么首先需要了解AP的概念。想要了解AP的概念,还要首先了解目标检测中Precision和Recall的概念。 首先我们设置置信度阈值(Confidence Threshold)和IoU阈值(一般设置为0.5,也会衡量0.75以及0.9的mAP值): 当一个预测边界框被认为是True Positive(TP)时,需要同时满足下面三个条件: Confidence Score > Confidence Threshold 预测类别匹配真实值(Ground truth)的类别 预测边界框的IoU大于设定的IoU阈值 不满足条件2或条件3,则认为是False Positive(FP)。当对应同一个真值有多个预测结果时,只有最高置信度分数的预测结果被认为是True Positive,其余被认为是False Positive。 Precision和Recall的概念如下图所示: Precision表示TP与预测边界框数量的比值 Recall表示TP与真实边界框数量的比值 改变不同的置信度阈值,可以获得多组Precision和Recall,Recall放X轴,Precision放Y轴,可以画出一个Precision-Recall曲线,简称P-R
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值