脑电图(EEG)信号反映了大脑神经元网络的生物电活动,可用于研究睡眠,诊断昏迷和癫痫患者,使用户能够与电子设备进行互动,并帮助人们从中风或其他损害正常大脑活动的状况中恢复。独立成分分析(ICA)是一种从脑电图中排除眼球运动和肌肉伪影等非脑信号的传统方法。独立成分(IC)的排除通常是在半自动模式下进行的,需要专家参与,并且各个专家的意见往往不一致。来自俄罗斯国立高等经济大学生物电接口中心和RAS高级神经活动和神经生理学研究所的研究人员开发了一个工具箱和在线众包平台,用于脑电图中独立成分的自动标记(ALICE)。
工具与方法
脑电图工具箱高级架构中独立组件的自动标记
脑电图独立部件的自动标注包括两个模块(图1):标注模块:由用户界面和IC数据库组成。HTTP API允许上传IC数据到数据库。基于Web的用户界面允许专家对上传的数据进行标注,以供未来的ML模型训练和验证。
ML模块基于Python库,该库根据专家标记训练ML模型,并使用预先训练的ML模型应用于新的IC数据。
图1. ALICE工具箱高级架构和用户角色
机器学习流程:如图2所示,带标注的原始IC数据被传递到数据标签聚合块(DataLabels Aggregation)和特征计算块(Features Calculation),根据相应的策略形成带标签的数据集,并从IC中提取信息特征。通过重复训练测试分割交叉验证(在70%的样本上训练模型,并对其余30%的样本进行重复训练-测试交叉验证)训练了三个ML模型(逻辑回归(LR)、线性支持向量机(SVM)和梯度提升(XGB)),并计算了不同的模型评估指标(特征曲线下面积(ROC-AUC)、精准召回曲线下面积(PR-AUC)和F1分数(F1-score))。然后选择最佳模型,并将其导出为Python pickle-object(Python的一种数据存储方式)。
图2.ALICE中的数据处理和机器学习流程
验证性实验与结果
初始数据集:基线模型训练采用IHNA&NPh RAS提供的数据集,该数据标注由RAS高级神经活动和神经生理学研究所的两名经验丰富的科学家进行。
额外的数据集:为了进一步验证,儿童脑电图数据集和成人数据添加到ALICE平台。
数据标签整合:由于可用数据有限,缺乏实际的线路噪声和只有两个标注策略。因此决定合并一些类,在标注器之间使用少量的标签匹配。Alpha和Mu标签被标记为大脑标签。对于其余的IC类,根据表1规则使用整合策略。当特定类的样本代表性较差时,采取多数投票策略,以有足够的标记样本进行模型拟合;否则,将采取概率投票策略。
独立组件分类:将LR、XGB和SVM作为ML模型,并计算ROC-AUC和PR-AUC评分作为性能指标。我们分别为每种IC类型选择了三种型号。基于ROC-AUC曲线,所有模型对于大多数IC类都显示出可比较的性能(ROC曲线见图3,数值见表2)。其中Brain、Eyes和Muscle模型的ROC-AUC均大于0.9。
图3.所有IC类型和ML模型的聚集受试者工作特征(ROC)曲线
专家意见的差异和策略处理的差异
由于专家意见缺乏一致性以及可能没有特征,导致标注不充分,我们无法训练出好的Heart ICs检测模型。然而, 但在分析PR曲线和PR-AUC值时,情况有所不同(见图4和表3)。
图4. 所有IC类型和ML模型的整合精确召回率(PR)曲线
ALICE工具箱的目标是建立一个可持续的算法,利用累积的专家知识进行ICA分解,去除脑电信号中的伪影并找到特定的模式。随着越来越多的研究人员和临床医生为这个平台做出贡献,该平台逐渐发展为医学科学家和极客社区的中心,涵盖睡眠研究、中风康复、癫痫诊断、脑机接口等等。
原文链接:
https://www.frontiersin.org/articles/10.3389/fninf.2021.720229/full
仅用于学术交流,若有侵权及疑问,请后台留言,管理员即时删侵!
更多阅读
加入社群
欢迎加入脑机接口社区交流群,
探讨脑机接口领域话题,实时跟踪脑机接口前沿。
加微信群:
添加微信:RoseBCI【备注:姓名+行业/专业】。
加QQ群:104048131
欢迎来稿
1.欢迎来稿。投稿咨询,请联系微信:RoseBCI
2.加入社区成为兼职创作者,请联系微信:RoseBCI
助力脑机接口发展
点个在看祝你开心一整天!