运动想象中共空间模式算法（CSP）的实现

最新推荐文章于 2024-06-24 17:31:17 发布

zhoudapeng01

最新推荐文章于 2024-06-24 17:31:17 发布

阅读量1.2w

点赞数 48

分类专栏： MNE 算法 python

本文链接：https://blog.csdn.net/zhoudapeng01/article/details/104969977

版权

python 同时被 3 个专栏收录

20 篇文章 7 订阅

订阅专栏

算法

19 篇文章 7 订阅

订阅专栏

MNE

15 篇文章 52 订阅

订阅专栏

最近在研究运动想象算法，其中CSP来提取特征用的比较多，尤其是在二分类的问题中，之前写过一篇如何在MNE库中实现CSP算法的博客，用的是MNE库中已经写好的算法，现在想自己实现该算法，研究了几天发现坑还是比较多的。。。先列出一些参考的博客文章，里面有对应的算法在matlab中的实现，后面主要是解释算法中的一些细节以及自己对该算法的理解。强烈建议下载本博客的资源包对照着看，里面是整理好的博客中用到的资料。

https://download.csdn.net/download/zhoudapeng01/12258861

CSP原理：

https://blog.csdn.net/oh__NO/article/details/84310982

CSP在Python MNE库中的实现

https://blog.csdn.net/zhoudapeng01/article/details/103979381

matlab代码实现：

https://blog.csdn.net/MissXy_/article/details/81264953

https://blog.csdn.net/sinat_35162460/article/details/87947521

上面既然都有实现好的版本了，本着拿来主义的思想本来不打算自己开发的，但是考虑到后面需要支持多种编程语言的实现，以及验证算法的准确性，我在python中也实现了一遍，并尝试理解每一条语句的意义，及其对应的原理。不弄不知道啊，一弄发现了很多有趣的细节。

一句话总结CSP算法：共空间模式算法的基本原理是利用矩阵的对角化。找到一组最优空间滤波器进行投影，使两类信号的方差差异化最大，从而得到具有较高区分度的特征向量。

上面所说的特征向量也就相当于滤波器，输入数据经过和特征向量的运算就会得到最大差异化方差的信号，这个信号我理解为是“原始波形”，测量结果=原始波形 * 电极位置，这一点在后面会详细解释。

算法的实现原理在前面的博客中都有所介绍，希望大家能对照着看，公式的推导这里就不再赘述，下面主要说一下对应的代码实现中遇到的问题。

问题1 求协方差矩阵

所有的资料第一步都是求对应数据的协方差矩阵，其对应的计算公式为

不知道大家有没有注意到这根本不是协方差矩阵的标准形式，协方差矩阵的计算方法见：https://blog.csdn.net/Mr_HHH/article/details/78490576。协方差的计算应该是去均值后的数据，并且是对列的运算，矩阵X的协方差计算公式为：

那为什么在这里会这么计算呢？对行计算这个问题好解释，因为脑波数据一般都是按行存储的，这就是转置的问题。可是为什么它不用减去均值，并且也没有求平均。这个问题困扰了我好久，最后在一篇文献中找到了想要的答案。

《Designing optimal spatial filters for single-trial EEG classification in a movement task》文章的796页有如下两段话。

文章下载链接：https://download.csdn.net/download/zhoudapeng01/12256499

第一段话主要的意思是说，EEG数据是滤波后的，均值为零，看到这恍然大悟，滤波后的数据没有直频分量，均值那可不就是零么，那也就不用减均值了。

第二段话主要的意思是说，正则化是为了消除不同实验对值的影响，所以使用的是迹。

问题2 特征值排序获取白化矩阵

排序是为了找到影响大的特征向量这个好理解，在文章《Multiclass Common Spatial Pattern for EEG based Brain Computer Interface with Adaptive Learning Classifier》中第3页有提到这个步骤。

上文提到的matlab代码中有一个小问题，代码中直接对特征值进行了排序，我个人的理解是应该对特征值的绝对值排序，因为特征值有可能出现负值的。

问题3 为什么最后提取的特征值是和方差有关的一个量

提取特征的计算公式如下，可为什么是方差呢?

这个问题在《Optimizing spatial filters for robust EEG single-trial analysis》一文中有所解释，文章的第4页有如下一段话，大致的意思是说带通滤波后的信号方差和能量有关，虽然还是不太理解，不过总算找到一些理论依据了。

文章文章链接：https://download.csdn.net/download/zhoudapeng01/12256503

在上面提到的matlab代码中，在提取特征的时候，还对方差求了一个log:

我想作者可能是借鉴了《Multiclass Common Spatial Pattern for EEG based Brain Computer Interface with Adaptive Learning Classifier》这篇文章，文章第3页中有如下公式：

matlab代码的Python实现

至此流程上算是理解了，参考matlab中的实现，实现了该算法的python版，为了对比计算结果，保留了特征值排序的问题，相当于matlab代码中一比一的实现。

EEG_Channels = trainData.shape[1]
EEG_Trials = trainData.shape[0]
classLabels = np.unique(trainLabels)
EEG_Classes = len(classLabels)
covMatrix = list(range(EEG_Classes))
trialCov = np.zeros([EEG_Channels, EEG_Channels, EEG_Trials])
for i in range(EEG_Trials):
    E = trainData[i]
    EE = np.dot(E, E.T)
    trialCov[:, :, i] = EE/np.trace(EE)

for i in range(EEG_Classes):
    covMatrix[i] = np.mean(trialCov[:, :, trainLabels == classLabels[i]], 2)

print('a' ,covMatrix[0])
print(covMatrix[1])
covTotal = covMatrix[0] + covMatrix[1]

#########特征值降序
eigenvalues, featurevectors = np.linalg.eig(covTotal)
egIndex = np.argsort(eigenvalues)[::-1]
eigenvalues = np.sort(eigenvalues)[::-1]
Ut = featurevectors[:, egIndex]
# 矩阵白化
P = np.dot(np.diag(np.sqrt(1/eigenvalues)), Ut.T)
# 矩阵P作用求公共特征向量transformedCov1
transformedCov1 = P.dot(covMatrix[0]).dot(P.T)
# 计算公共特征向量transformedCov1的特征向量和特征矩阵
eigenvalues, featurevectors = np.linalg.eig(transformedCov1)
egIndex = np.argsort(eigenvalues)[::-1]
eigenvalues = np.sort(eigenvalues)[::-1]
U1 = featurevectors[:, egIndex]
# 计算投影矩阵W
CSPMatrix = U1.T.dot(P)

# 计算特征矩阵
FilterPairs = 2
feature_train = np.zeros([EEG_Trials, 2*FilterPairs+1])
feature_test = np.zeros([EEG_Trials, 2*FilterPairs+1])
Filter = np.r_[CSPMatrix[:FilterPairs], CSPMatrix[-FilterPairs:]]

#从每一次实验中提取CSP特征
for t in range(EEG_Trials):
    # 将数据投影到CSP空间
    projectedTrial_train = Filter.dot(trainData[t])
    projectedTrial_test = Filter.dot(trainData[t])
    # 投影后信号的方差作为特征
    variances_train = np.var(projectedTrial_train, 1)
    variances_test = np.var(projectedTrial_test, 1)
    for f in range(len(variances_train)):
        feature_train[t, f] = np.log(variances_train[f])

    for f in range(len(variances_test)):
        feature_test[t, f] = np.log(variances_test[f])



CSP_Train_faetures = feature_train[:, 0:4]
CSP_Test_features = feature_test[:, 0:4]