导言
多尺度熵(Multiscale entropy, MSE)将样本熵扩展到多个时间尺度,以便在时间尺度不确定时提供额外的观察视角。样本熵的问题在于它没有很好地考虑到时间序列中可能存在的不同时间尺度。为了计算不同时间尺度下信号的复杂性,Costa等人(2002,2005)提出了多尺度熵。
与其他熵测量方法一样,多尺度熵的目标是评估时间序列的复杂性。使用多尺度熵的主要原因之一是不知道时间序列中相关的时间尺度。例如,在分析语音信号时,在单词时间尺度下统计信号的复杂度会比统计整个语音片段的复杂度更加有效。但如果你不知道音频信号代表语音,甚至对语音概念没有任何了解,你就不知道应该运用什么时间尺度以从原始信号中获得更多有用的信息。因此,通过多个时间尺度来分析问题将会得到更多信息。在脑电图中,潜在的脑电模式是未知的,因此相关的时间尺度也是未知的。所以,需要通过多尺度样本熵来分析哪个尺度对特定场合下脑电信号的分析更有用。
计算多尺度熵
多尺度熵的基本原理包括对时间序列进行粗粒化或下采样 - 主要是在越来越粗略的时间分辨率下分析时间序列。具体操作如下:
假设有以采样频率为1kHz采样得到的时间序列(原始时间尺度T为1 ms):
x
1
x_1
x1,
x
2
x_2
x2,
x
3
x_3
x3,…,
x
N
x_N
xN
粗粒化( Coarse Graining)数据意味着对不同数量的连续点取平均值,以创建不同尺度(或分辨率)的信号.
-
当scale为1时,粗粒化数据的结果就是原始时间序列.
-
当scale为2时,粗粒化后的时间序列是通过计算两个连续时间点的平均值形成的,如下图(A)所示。即定义: y 1 = ( x 1 + x 2 ) / 2 ; y 2 = ( x 3 + x 4 ) / 2 y_1 = (x_1 + x_2)/2; y_2 = (x_3 + x_4)/2 y1=(x1+x2)/2;y2=(x3+x4)/2,以此类推.
-
当scale为3时,粗粒化时间序列为三个连续时间点的平均值构成,如下图(B)所示。即定义: y 1 = ( x 1 + x 2 + x 3 ) / 3 ; y 2 = ( x 4 + x 5 + x 6 ) / 3 y_1 = (x_1 + x_2 + x_3)/3; y_2 = (x_4 + x_5 + x_6)/3 y1=(x1+x2+x3)/3;y2=(x4+x5+x6)/3,依此类推.
图示来自文献[1].
粗粒化过程分为两种形式:一是非重叠式,每次跳跃τ个数据,取τ个数据做平均以产生新的数据;二是重叠式,每次跳跃1-τ个数据,取τ个数据做平均。
上述粗粒化过程为非重叠式,其数学定义为:
y
j
(
τ
)
=
1
τ
∑
i
=
(
j
−
1
)
τ
+
1
j
τ
x
i
,
1
≤
j
≤
N
τ
y_{j}^{(\tau)}=\frac{1}{\tau} \sum_{i=(j-1)\tau+1}^{j\tau} x_i, 1 \leq j \leq \frac{N}{\tau}
yj(τ)=τ1i=(j−1)τ+1∑jτxi,1≤j≤τN
其中,τ表示时间尺度.
然后,计算与每个尺度或分辨率对应的样本熵,并绘制样本熵-尺度曲线图。曲线下的面积是所选尺度范围内样本熵值之和,是多尺度熵的度量。一个波动较大的时间序列会产生较大的熵值,因此可以认为是具有较高复杂度的信号。同样,具有高度规律性的信号,其熵值也较低。
多尺度熵在脑电分析中的应用
由于MSE计算不同时间尺度下信号的熵,因此对于理解像EEG等生物信号在不同时间尺度下的复杂度变化十分有用. 熵与时间尺度的曲线可能会产生一个峰值,表明在该时间尺度下存在最大熵,该时间尺度可能具有更大的相关性。
事实上,Escudero等人[2]的研究表明,即使在10个电极的大时间尺度上,MSE也能发现阿尔茨海默症患者和对照组之间的显著差异,而且与对照组相比,阿尔茨海默症患者的脑电图活动没有那么复杂.
在Partk等人[3]的另一项研究中,他们对正常受试者(Normal)、阿尔茨海默病患者(Severe AD)和轻度认知障碍(MCI)患者的脑电信号进行了MSE分析。结果再次显示,阿尔茨海默病(AD)患者脑电信号的复杂性降低,其熵值较低,如图所示。正常和MCI被试在尺度为6、7时具有局部最大熵值,之后熵值下降。他们的分析还表明,在时间尺度因子为1时,轻度认知障碍、阿尔茨海默病和正常受试者的样本熵在统计学上是无法区分的,因此,在这种情况下,样本熵或近似熵等熵指标无法区分健康受试者和病理受试者.
在另一项研究中,Catarino等人[4]对健康受试者和自闭症谱系障碍(ASD)患者在执行社交和非社交任务(包括面部和椅子构成的视觉刺激)时的脑电信号进行了MSE分析。他们的结果显示,在枕叶和顶叶区域,与对照组相比,自闭症组的脑电图复杂性显著下降(p值统计结果).
图片来自文献[4]
因此,尽管以非特异性的方式,各种疾病状态都体现为MSE测量值下降。
MSE中的参数
MSE只是简单地将样本熵度量扩展到不同的时间尺度,因此,基础参数m(比较的线段长度)和r(两个线段之间的距离度量)是相同的。在前面的博客文章中讨论过,这些参数对于MSE的性能非常重要。关于如何选择这些参数,并没有标准的指导准则。对于数据长度m, 研究表明在MSE应用中,需要保证每个时间尺度下有足够的数据量。Costa等人[5]的研究表明,当白噪声和 1/f 噪声的数据点减少时,样本熵的均值(超过30个尺度)会发散。特别是在 1/f 噪声情况下,由于其非平稳性,与白噪声相比,发散速度更快。要查看参数m,r和数据长度对样本熵的影响,请参阅我们之前的博客文章以及Costa等人关于这些问题的另一篇优秀文章[5].
关于r,需要记住的是,为了避免噪声对样本熵估计的显著贡献,r必须大于大部分的信号噪声。选择r的另一个标准是基于信号的动态特性(signal dynamics)。
然而,最重要的方面是计算r的方式,以及所选择的距离测量(通常是欧几里德距离)是否真正与时间序列相关。例如,对于语音信号,欧几里德距离可能不是两个单词之间距离的最精确度量。脑电图完全有可能也是这种情况。
参考文献
[1] Busa, Michael A., and Richard EA van Emmerik. “Multiscale entropy: A tool for understanding the complexity of postural control.” Journal of Sport and Health Science 5.1 (2016): 44-51.
[2] Escudero, J., et al. “Analysis of electroencephalograms in Alzheimer’s disease patients with multiscale entropy.” Physiological measurement 27.11 (2006): 1091.
[3] Park, Jeong-Hyeon, et al. “Multiscale entropy analysis of EEG from patients under different pathological conditions.” Fractals15.04 (2007): 399-404.
[4] Catarino, Ana, et al. “Atypical EEG complexity in autism spectrum conditions: a multiscale entropy analysis.” Clinical neurophysiology 122.12 (2011): 2375-2383.
[5] Costa, Madalena, Ary L. Goldberger, and C-K. Peng. “Multiscale entropy analysis of biological signals.” Physical review E 71.2 (2005): 021906.
本文章由脑际爱好者笔记分享QQ交流群:903290195
更多分享,请关注公众号: