笔记2(基础实验介绍)-THE TUH EEG CORPUS: A Big Data Resource for Automated EEG Interpretation(论文)

基础实验:

         想对这些数据进行研究的时候,很重要的一点就是要和神经科医生反复讨论脑电图定义的事件。也就是说要深入理解EEG是如何被手动解释的,并将该过程转换为算法描述。经过多次讨论,我们将重点放在六路分类上。

(1) 棘波和/或尖波(SPSW):癫痫患者典型的癫痫样瞬变。

(2) 周期性偏侧性癫痫样放电(PLED):脑电图异常,由重复性的棘波或尖波放电组成,在一个半球呈局灶性或偏侧性,并以几乎固定的时间间隔复发。

(3) 广义周期性癫癎样放电(GPED):周期性短间隔弥漫性放电、周期性长间隔弥漫性放电,并根据放电间隔的不同表现为抑制性发作。三相波(弥漫性和双侧同步尖峰,双侧占优势,通常以1-2赫兹的频率周期性出现)也包括在这一类中。

(4) 伪影(ARTF):记录的非脑源性电活动,如由设备或环境引起的。

(5) 眨眼:通常会被混淆为峰值的常见事件。

(6) 背景(BCKG):所有其他信号。

六路信号的分析:

          这六路分类实验跟其他检测中风和癫痫的实验非常相似。

          前三类是信息承载类,因为它们描述了在人工解释脑电图中至关重要的事件。这三类事件的主要区别是周期性的程度和这些事件跨渠道发生的程度。

         最后三个类用于改进背景模型。背景建模是任何试图对信号的时间演化进行建模的机器学习系统(如隐马尔可夫模型)的重要组成部分。我们让系统自动进行背景/非背景分类作为建模过程的一部分,而不是使用启发式预处理算法来检测感兴趣的信号。

         伪影(噪声)和眨眼现象频繁出现,值得单独学习。

         与前五个类不匹配的其余事件被集中到后台类中。因此,后台类模型的健壮性和强大性是非常重要的。

         此外,模型表现的关键方面与前三类的敏感性和特异性有关,因为这些是神经病学家解释的关键;

  特征提取:

         使用标准滤波器组/倒谱系数方法对数据进行特征提取[6]。目前的整个系统对核心特征集并不十分敏感,只能充分模拟大约0.5赫兹到25赫兹的光谱范围。作者使用8波段滤波器组分析,将其转换为包含8个倒谱系数和能量的9元素特征向量。后者采用频域方法计算。

 

   建模:

           提取特征后,作者为每一个分类训练了一个隐马尔科夫模型(HMM)。HMM适用于时间序列数据的建模。采用期望最大化(EM)算法对模型进行训练。下图提供了培训过程的概述。使用主动学习方法引导系统从少量数据到较大的子集。

 

 

数据准备:

        数据准备是一个很大的挑战,包括根据从医生报告中自动提取的信息将文件聚类到适当的类中。作者最初用一种完全无监督的方式使用主动学习方法训练他的系统。然后,让专家手动标记了少量数据。

        作者仔细挑选了100个10秒的epoch,其中包含了大量的SPSW类示例以及一些GPED和PLED示例,然后用这些数据训练。作者也正在注释另外70个10秒的epoch,作为一个保留的评估集。

实验结果和分析:

      作者这个实验处理是单通道的,也就是每个通道都是独立分析处理的。

      但是通过如果跨通道地观察,可以很容易地识别出一些事件。

      所以作者正在开发第二个机器学习模块,该模块将对来自所有通道的假设进行后处理。该模块将大大降低误报率。

      在下表中,作者根据测试结果给出了基于HMM的系统的混淆矩阵:

       从上表可以看出,SPSW, PLED,和 GPED这三个基本类的准确率都超过了40%,但是误报率也在40%左右。幸运的是,要在临床上应用我们不需要准确地判断每一个峰值,它只需要检测到足够的峰值,一个神经学家就可以很快地判断出来。需要重点关注的是在误报率导致要审查更多错误数据上。

       为了更好地评估这些结果,作者将系统和Wulsin等人使用的深度信念网络的方法进行了比较,Wulsin等人。使用了一个小型的专有临床脑电图数据库,由两名神经科医生手动转录。这两项研究使用了非常相似的分类,尽管对信号的非尖峰部分建模的方法有些不同。在他们的研究中,使用的性能指标是Fscore,灵敏度和特异性的调和平均值:

                                                         

          Wulsin等人的深度信念网络的Fscore是0.476.而作者的模型Fscore是0.702。

下表显示了假警报和检测(正确识别)之间的权衡:

          我们可以通过简单地修改最可能类的似然值的阈值来改变这条曲线上的操作点。由于临床医生更愿意花时间来检查错误的数据,这会降低他们的工作效率。

          根据与坦普尔大学医院神经科医生的讨论,我们对三个主要事件类别的检出率目标是95%,而虚警率的目标是5%。

          令人鼓舞的是,三个主要事件类和三个背景事件类之间的混淆相对较小。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值