EEG脑电数据预处理-原理篇

fdgdf5535

于 2024-02-12 03:33:06 发布

阅读量1.5k

点赞数 21

文章标签：人工智能

本文链接：https://blog.csdn.net/fdgdf5535/article/details/136096350

版权

本文不涉及具体的操作步骤，而是对脑电数据预处理中的每一步进行解说，根据我自己的经验来解释为什么要这么做，希望能够对刚入门脑电数据的朋友有所帮助。如果发现有什么错漏之处，也请指正。只想看操作的话可以看这篇EEGLAB数据预处理

第一期：使用Matlab和eeglab对脑电数据进行预处理_哔哩哔哩_bilibili

基本步骤

定位通道位置
删除无用通道
滤波
分段
基线校正
重参考
降低采样率
插值坏导
独立主成分分析
剔除坏段

0. EEG data

首先要认识脑电数据是什么样子。我们采集到的原始信号，是一系列随着时间变化而不断变化的曲线，如下图所示，这是一个8个通道的示例数据，一共有两种mark类型，分别为S1跟S2。
mark，或者event，或者trigger，其实表示的都是同一个意思，即在我们关注的事件发生时，打上一个我们认得出的标记，这样子就可以从我们收集到的一长段数据中，找到我们感兴趣的事件范围了。

EEG示例数据

1. 定位通道数据

首先我们将EEG数据加载进eeglab之后，eeglab能够读取到的仅仅是每一个通道的名称和数值，但是它并不知道这个通道是位于头皮上的什么地方，因此我们需要加载进一个跟记录数据时相匹配的通道位置信息
eeglab中默认的文件是 standard-10-5-cap385，指的是按照国际10-5系统排布的一共有385个电极点信息的模板，一般来说使用这个模板就可以了。
关于模板的更多信息还可以看这里脑电定位系统

2. 删除无用数据

在采集数据的过程中，有可能会记录一些后期并不需要用到的通道信息，这时候我们就可以将它们剔除掉，不必纳入后续的分析中。
比如双侧乳突点。
又比如眼电通道的数据。在使用eeglab来对数据进行预处理的时候，可以通过ICA的方式来去除眼电成分，而这种方式可以不需要眼电通道数据的参与就可以进行。

3.滤波

滤波分为高通滤波，低通滤波，带通滤波和凹陷滤波。
高通滤波是指，高于某个频率的信号可以通过，而低于这个频率的信号会被衰减过滤掉。而低通滤波则相反，指的是低于某个频率的信号可以通过，而高于这个频率的信号则相反。所以，在输入数值的时候，高通滤波要输入的是一个较小的数字，而低通滤波则是输入一个较大的数字。这可能跟我们的第一反应有点相悖。因此，也可以用它们的英文叫法来辨别，高通high-pass，低通low-pass，英文看起来就更为直观了。
而带通滤波，指的是在某个频率段范围内的信号可以通过，而这个频率段范围以外的信号会被衰减过滤掉，就相当于同时做了高通滤波和低通滤波。
凹陷滤波，指的是在某个频率范围内的信号会被衰减过滤掉，而这个频率范围以外的信号会被保留下来。这个操作通常是用来去除50Hz市电的干扰。我国的50Hz，因此在收集到的信号中，会有一个非常强烈的50Hz频段的信号存在，这就可以用凹陷滤波来去掉。
值得注意的是，滤波并不能完全过滤出我们想要的频段。比如30Hz的低通滤波，并不是说30Hz以外的信号就通通被过滤掉了，而是以30Hz为截止频率，高于这个截止频率的信号会被逐渐衰减。
如下图所示，横轴为频率，纵轴为增益系数，在截止频率f的左边，最开始的增益系数皆为1，指的是信号乘以1，被完整保留下来，而在接近截止频率的一定范围内，增益系数开始逐渐下降，直到我们的截止频率f处，增益系数正好是0.5，指的是经过了截止频率为f的低通滤波之后，f这个频段的数据有50%被过滤，而50%被保留下来。随后增益系数再逐渐下降，信号被逐渐衰减，直至接近于0。
因此，我们有时候会看到数据在做了30Hz的低通滤波之后，还会再做一个50Hz的凹陷滤波，就是因为，并不是做了30Hz的低通滤波就能够完全把30Hz以上的信号全部过滤掉，而50Hz的干扰又是非常强的，所以最好还是再做一个50Hz的凹陷滤波。

低通滤波器

4.分段

我们的数据是从实验开始到实验结束时全程记录的，但是我们感兴趣的，只是被试在接受到某个刺激，或者做出某个反应时那段事件的信号，因此，我们要根据我们打上的mark，讲数据切分成一段一段的，而在这些范围以外的数据，我们就不要了。
一般的ERP分段在事件前200毫秒到事件后1000毫秒这个时间段就足够了，因为几乎所有的ERP成分，都是在1秒以内产生的。但是如果后期还要做时频分析的话，则需要将分段时间拉长，扩大到事件前1秒到事件后2秒这个时间段内，因为时频分析的算法，要求数据要有一定的长度。

5.基线校正

在ERP实验中，我们关心的是这个刺激事件带给被试什么样的变化，因此需要有一个比较。而在事件发生之前的时间里，我们认为被试是处于一个相对平静的状态，此时的脑电活动，代表了一个平静状态下的脑电活动。所以我们将这段时间内的脑电活动当成一个基线，拿事件发生之后的活动去跟它做比较，来分辨刺激事件到底让被试产生了什么样的活动。
一般来说，都是以分段中，事件之前这段时间来作为基线的，比如分段为-200毫秒到1000毫秒，那就将所有的数据，减去前200毫米以内数据的均值。换言之，，就是将这前200毫秒以内的数据均值当成是“海平面”，所有其他的数据的数值，都是相对于这个“海平面”数据的高度。
基线校正的第二个作用，防止数据漂移带来的影响。有时候因为某些原因，我们采集到的数据，会呈现一个逐渐缓慢向上漂移的趋势，而在分完段之后，由于向上飘的影响，每一段数据的起点将不在同一个地方，也会使得这段数据的绝对波幅变高。而基线校正就可以校正这种漂移带来的影响，让每一段数据都拥有一个差不多的起点。

6. 重参考

首先要解释的是参考的定义。我们看到采集之后的数据是一个个的数值，但这个数值是什么意思呢，就是电极所在位置跟参考电极之间的电位差。
一般在脑电记录的时候会采用的参考电极有鼻尖参考，cz或头顶中央参考，还有单侧乳突参考，乳突就是耳朵后面一小块突起的区域。我们所看到的每个通道的数值，其实就是指这个通道跟参考通道之间的电位差。
在分析数据的时候，有时候我们会想要转换参考点的位置。因为不同位置的参考，会对数据造成一定的影响。比如记录时采用的是cz或头顶中央参考，那么自然地，距离cz点较近的电极点，记录到的电位差会非常小，而离得远的电极记录到的电位差就自然会大一点，这种大与小的差异，并不是由认知活动产生的，而是由记录方式产生的。又比如，单侧乳突参考，那脑袋左边的电极点跟右边的电极点，也会存在着记录方式不同产生的电位差不同。
常用的一些参考位置有双侧乳突平均参考，指将两个乳突数据的平均值作为参考数据，或者是全脑平均参考，指的是将全脑所有数据的均值作为参考数据的方法，不过使用全脑平均参考的时候要注意，眼电数据不要纳入其中，因为眼电数据的波动起伏非常大，很容易对数据造成比较大的干扰。

7. 降低采样率

采样率的单位是Hz，指的是一秒内要记录多少个数据点的意思，比如原始数据的采样率是1000Hz的话，就是代表一秒内有1000个数据点。
在后期分析的时候，我们有时候会想要降低采样率，比如降到500Hz或者250Hz。这样做最大的好处其实就是减小数据量，以提高计算速度，没有其他的作用了。所以这一步并不是必须的。
但降低采样率需要注意两点，一是降低采样率要在滤波之后。因为降低采样率会使我们丢失高频信息，使高频信息变得扭曲，所以最好在保留了我们感兴趣波段之后再去降低采样率，这样可以保证信号最大程度不会失真。二是有一个采样定理，理论上来说，我们的采样率必须是我们想要分析的波段的两倍，比如我们想要分析60Hz的波，那数据采样率为120Hz就足够了。实际上，建议采样率最好在分析波段的三到四倍。

8. 插值坏导

在做完上述这些处理之后，可以保存一下数据。因为在这之前的操作，是每个被试都需要做的基础操作，后期我们可以通过代码来实现批处理。而在这之后的操作，是需要根据每个被试的具体情况具体分析去处理的，因此只能一个个做，不能进行批处理。
从这一步开始可以说是真正的去除伪迹的过程了。去伪迹大体分为两种，横向操作和纵向操作，横向即对通道进行校正操作，对数据不好的导联进行插值处理，纵向是指挑出数据不好的trials，删除掉。建议是先横向处理后再纵向剔除，尽量保留下更多的trials数。
EEGLAB中插值坏导有两种方式，一种是以某通道周围几个通道的数据的平均值，来替代这个通道的数据，这种直接通过代码实现即可。另外一种是EEGLAB里内置的一种算法实现，具体换算是什么过程我也不太清楚，但是我问过贾会宾老师，他是推荐使用第二种方法。原因在于，我们记录的是头皮脑电，头是一个球体，因此直接用周围数据的均值来代替这种方法有点粗糙，而EEGLAB内置的方法则会考虑到容积传导效应，以及近的点和远的点贡献的权重不同来进行插值，因此会更加有效。

9. 独立主成分分析

这是一个很有用但也很难的方法，我并不是十分清楚它的原理，只能大概理解，也只能大概描述一下。前面说过，我们记录到的是头皮脑电，脑电帽上划出了一个个的点来表示位置，但是我们在FPz点记录到的数据，就真的是FPz点这个位置头皮下方的区域所产生的电活动？不一定。做过实验的都知道，眨眼会产生影响，左右看会产生影响，帽子戴得太紧导致肌肉紧张也会产生影响，还有左右的FP1，FP2处产生的电活动也会影响到FPz，甚至在离它最远的Oz点下方产生的电活动，也有可能对前方FPz点产生微弱的影响。因为真正的电活动产生于头皮下方颅骨内部，它经过了这么一层又一层的传播之后，不同源的电活动肯定会相互影响，从而导致某个记录点记录到的数据，混合了很多不同成分的电活动。而独立主成分分析，就是要对记录点的数据做一个逆运算，把每个记录点的数据，分解成一个又一个的成分组成。然后我们再从中剔除掉伪迹成分，比如眨眼的成分，肌肉紧张的成分等，从而得到一个相对干净的数据。
至于如何识别各种伪迹成分，可以看这篇文章如何识别ICA成分

10. 剔除坏段

预处理到了这一步，已经接近于完成了。最后一个步骤就是要剔除掉波幅超过100微幅的trial(要求严格一点也可以定位80)，因为波幅起伏这么大的活动，已经不是由认知活动引起的了，肯定是由于其他的动作引起的，所以可以直接剔除掉。
这一步操作一定要在插值坏导和ICA去除眼电成分之后再做，因为有可能被试眨眼比较频繁，那这么操作下来，有可能就需要删掉接近一半的trials数了，删掉的trials数太多，这个数据也就废了。所以要将它留到最后一步才做，同时，这个操作也能用来检查我们前两步操作是否足够有效。

作者：亚内士多德
链接：https://www.jianshu.com/p/791c3651e9ad
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

fdgdf5535

关注

21
点赞
踩
33

收藏

觉得还不错? 一键收藏
0
评论
EEG脑电数据预处理-原理篇

本文不涉及具体的操作步骤，而是对脑电数据预处理中的每一步进行解说，根据我自己的经验来解释为什么要这么做，希望能够对刚入门脑电数据的朋友有所帮助。如果发现有什么错漏之处，也请指正。只想看操作的话可以看这篇。
复制链接

扫一扫