EpilepsyGAN:具有隐私保护的合成癫痫脑活动-2021(同26)

爱吃榴莲的妹妹

已于 2023-01-07 15:41:36 修改

阅读量1.3k

点赞数 1

分类专栏： gan生成时间序列论文研读文章标签：人工智能

于 2023-01-02 23:35:48 首次发布

本文链接：https://blog.csdn.net/Crystalxxtt/article/details/128453348

版权

文章介绍了EpilepsyGAN，这是一种生成对抗网络模型，用于生成类似癫痫发作的脑电图信号，以训练癫痫检测算法，同时保护患者隐私。实验表明，使用EpilepsyGAN生成的合成数据在癫痫检测任务中的性能与真实数据相当，且降低了患者重新识别的风险，从而解决了数据共享的隐私问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

EpilepsyGAN: Synthetic Epileptic Brain Activities with Privacy Preservation

Abstract

癫痫是一种慢性神经系统疾病，影响全世界6500多万人，表现为反复发作的无端癫痫发作。癫痫发作的不可预测性不仅会降低患者的生活质量，而且还可能危及生命。目前正在开发监测脑电图(EEG)信号的现代系统，以检测癫痫发作，以提醒护理人员并减少癫痫发作对患者生活质量的影响。这种癫痫检测系统采用最先进的机器学习算法，需要大量标记的个人数据进行训练。然而，对于医学专家和患者来说，在癫痫发作期间获取脑电图信号是一个昂贵且耗时的过程。此外，这些数据通常包含敏感的个人信息，引起隐私问题。在这项工作中，我们生成了合成的类似癫痫发作的脑电活动，即EEG信号，可用于训练癫痫发作检测算法，减轻了对敏感记录数据的需求。我们的实验表明，用我们的GAN模型生成的合成癫痫发作数据成功地保护了患者的隐私，而不会在癫痫发作监测期间产生任何性能下降。

I. INTRODUCTION

癫痫是全球第四大最常见的慢性神经系统疾病，影响超过6500万人。癫痫表现为由于大脑异常活动引起的反复无端癫痫发作。三分之一的癫痫患者患有耐药性无法控制的癫痫发作，发作时间通常无法预测。癫痫发作的时间从几秒到几分钟不等，症状多种多样，包括感觉先兆、意识丧失、行为停止、自动运动和全身抽搐。癫痫不仅会降低患者的生活质量，而且复发性癫痫患者的死亡率比普通人群相应组高5倍[3]，[4]。在癫痫学术语中，发作期样本是从癫痫发作段提取的，而发作间期样本是从非癫痫发作段提取的。

使用可穿戴设备[5]-[10]进行持续实时监测是降低死亡率、提高癫痫患者生活水平和独立性的一个有前景的解决方案。可穿戴设备可以在较长时间内持续实时采集和处理患者的脑电图信号，以检测发作期。通过这种方式，当癫痫发作发生时，警报可以自动发送给护理人员或家庭成员。

然而，开发可靠的癫痫发作检测系统的一个根本障碍是缺乏足够的训练数据量。事实上，现代检测系统是由基于机器学习的算法[11]和[12]驱动的，这些算法需要大量记录发作期的样本，以便可靠地检测未来的癫痫发作。收集和标记癫痫患者的脑电图数据是一个昂贵的过程，目前需要患者在癫痫发作时被记录在监测单元中。在临床实践中，这种记录在少数患者中进行，并且在短时间内(通常为一周)进行，因此只能记录每位患者的几次癫痫发作[13]。围绕共享医疗数据存在的隐私担忧加剧了这一问题。

特别是，从匿名数据集[14]中重新识别患者的可能性和数据泄漏的风险阻碍了医疗数据的共享。

在这项工作中，为了解决上述问题，我们提出了EpilepsyGAN，一种生成对抗网络(GAN)[15]，它可以产生高质量的合成癫痫发作信号，我们证明了所提出的框架的有效性。据我们所知，这是第一次生成癫痫发作脑电图样本，并用于训练癫痫检测算法。然后，我们利用模型的生产力来解决癫痫监测案例中的隐私问题。为此，首先，我们证明，与基于真实数据的训练相比，使用合成数据训练癫痫监测系统不会降低癫痫发作检测性能。此外，我们强调了生物医学应用中潜在的隐私问题，特别是癫痫，并证明使用合成数据阻碍了对患者的重新识别。这构成了GANs的现实应用，对医疗保健和医疗数据隐私有直接影响。因此，我们工作的主要贡献总结如下:

1)生成模型能够产生真实的合成癫痫发作信号，可以训练癫痫监测系统，在癫痫发作检测方面具有与真实癫痫发作信号相似的性能。

2)应用合成数据保护隐私和一项关于真实和合成的发作期数据对患者再识别的脆弱性的比较研究表明，与真实数据相比，合成数据的脆弱性降低了7.2倍。

2相关工作

由于GANs的出现，合成数据生成领域取得了非凡的进展。近年来，GANs在计算机视觉[16]，[17]，音频[18]，[19]或自然语言处理[20]，[21]等各种具有挑战性的领域取得了出色的成绩。然而，它们在医疗领域的成功却较为有限。

在过去的几年里，为医疗应用生成可靠的合成数据在文献中得到了广泛的研究。一些研究使用医学成像[22]-[24]和重症监护病房(ICU)监测[25]-[27]等领域的合成数据来增强现有的训练集，以提高检测精度。尽管这种数据增强方法已被证明是有效的，但之前仅使用合成数据进行训练的尝试已经报告了[23]，[25]性能的严重退化，到目前为止还不可能不使用真实的训练数据。因此，无法访问真正的训练数据，只能获得纯合成训练集的情况仍然没有解决。然而，考虑到与收集和共享医疗数据[28]相关的困难和隐私问题，这在包括癫痫在内的一些医疗应用程序中是一个常见的场景。

在大脑信号的具体情况下，GANs应用于生成真实的合成信号，迄今为止取得的成功非常有限:[29]生成了类似脑电图的信号，没有在任何特定的任务或病理检测中证明合成数据的质量。[30]生成合成脑电图数据来增强脑机接口现有的真实训练集，但他们没有在完全合成的训练集上进行评估。[31]使用GAN对脑电图信号的空间分辨率进行上采样，尽管视觉质量有所改善，但与原始训练集相比，得到的训练集在心理图像分类任务中的准确度下降了4-9%。然而，尽管针对合成脑电图的生成，但目前的文献尚未涉及癫痫，特别是发作期样本的生成。

此外，在过去的几年里，GAN模型因为能够在隐私敏感的应用程序中生成真实的合成数据而引起了人们的关注。在具有敏感数据的医疗应用程序的背景下，DPGAN[32]和patgan[33]提出了差分私有GAN模型，其中通过在模型的梯度中添加噪声来获得隐私。他们的评估表明，pite - gan和DPGAN在高维数据集(如UCI癫痫发作识别数据集[34])中质量都大幅下降。差分隐私技术引入了众所周知的隐私级别(即附加噪声的大小)和性能之间的权衡。也就是说，当我们增加噪声量级时，合成数据以逐渐丧失效用为代价变得更加私密。

第二类隐私保护技术，如MedGAN[36]，通过自动编码器和GAN的组合生成高维合成离散变量。他们的结果表明，生成的数据和相应的训练记录之间的1对1映射很弱，这意味着合成数据保护了患者的隐私。MedGAN在电子健康记录(EHR)数据上取得了令人印象深刻的结果，然而，该数据本质上是离散的，因此这种类型的模型不能用于生成连续的生物医学信号，如脑电图。

在本文中，我们提出使用GANs来生成癫痫发作的合成数据，这是脑电图记录中罕见的事件，我们评估了生成的样本在癫痫检测任务中的质量和效用。此外，我们展示了患者重新识别的可能性，并证明使用我们的EpilepsyGAN模型产生的合成信号缓解了在癫痫发作检测问题中与共享敏感医疗数据相关的隐私问题。

3生成模型

GANs是一类深度生成模型，其中两个神经网络同时训练，同时在二个极小极大博弈中竞争。一个网络是一个鉴别器，用来估计样本是真实的还是合成的。另一个网络是生成器，其任务是生成真实的合成样本，最大限度地提高鉴别器出错的概率。在训练过程中，鉴别器提高了识别合成样本的能力，而生成器学习生成越来越逼真的样本来欺骗鉴别器。在

最低0.47元/天解锁文章