滤波器组共空间模式(Filter Bank Common Spatial Pattern,FBCSP)

Matlab FBCSP实现

   最近在进行运动想象分类的时候想利用FBCSP(Filter Bank Common Sptial Pattern)进行特征提取,但在网上搜索一番都没有找到实现FBCSP的matlab代码,所以打算自己用matlab编码。

FBCSP原理

   FBCSP是基于CSP(Common Sptial Pattern)的空域提取方法通过对频带分片加之特征选择算法实现的。
下面为FBCSP的原理图:

FBCSP Architecture
如上图所示,其中
Stage 1为对频带进行切片;
Stage 2对切片后的各个子频带进行CSP滤波;
Stage 3对进行CSP滤波后的特征进行特征选择;
Stage 4对特征选择后的数据放到分类器里面分类。

测试数据

   用到的测试数据为BCIcomp2002(data set |||)的左右手二分类运动想象数据集,数据集包括140trials的训练数据集以及140个trials的测试集。
其范式如下图所示:
在这里插入图片描述
数据集地址:http://www.bbci.de/competition/ii/
测试集标签: http://www.bbci.de/competition/ii/results/index.html#graz
(我已经把数据以及测试集标签上传到我的博客资源里面了,到我的博客资源就可以下载)

文件结构结构如下

在这里插入图片描述

数据结构如下

在这里插入图片描述

运行结果

   因为代码写的比较创促,所以打算用参考文献[1]的互信息特征选择算法还没有写,打算以后补充上(已经补上)。分类算法用matlab的svm工具箱,其中-c设置为2,-g设置为0.1250,也尝试过用网格搜索法确定-c -g的参数但最后出来的效果似乎不是很好(个人猜测可能是由于训练集样本太少,如果用网格搜索法确定-c -g的话可能容易导致过拟合,从而令到测试集结果不佳)。运行结果如下所示:
在这里插入图片描述

代码

主文件Test.m

// An highlighted block
tic
load BCIcomp2002.mat
X_train=x_train;  %训练集
Y_train=y_train;  %训练集标签
X_test=x_test;    %测试集
Y_test=y_test;    %测试集标签
CSPm=3;     %定义CSP-m参数
sampleRate=128;
startTime=3;
k=10;       %定义Mutual Select K values
freq=[7 12 16 20 24 28 30]; %设置子频带频率
[FBtrainf,proj,classNum]=FBCSP(X_train(sampleRate*startTime:end,:,:),Y_train,sampleRate,CSPm,freq); %对训练集数据进行FBCSP
kmax=size(FBtrainf,2);      %k不能超过kmax
%%  特征选择
rank=all_MuI(FBtrainf,Y_train);
selFeaTrain=FBtrainf(:,rank(1:k,2));                             %MuI selected train set features
%% 训练模型
model=svmtrain(Y_train,selFeaTrain,'-c 2 -g 0.1250'); %训练模型
fbtestf=FBCSPOnline(X_test(sampleRate*startTime:end,:,:),proj,classNum,sampleRate,CSPm,freq);  %对测试集数据进行FBCSP
selFeaTest=fbtestf(:,rank(1:k,2));                               %MuI test set features
% predict=svmpredict(Y_test,selFeaTest,model);
[predictlabel,ac,decv]=svmpredict(Y_test,selFeaTest,model);
ac_1=ac(1);
disp(ac_1);
toc  

FBCSP.m函数

%author:mao date:2020-10-8 
%programme:the Filter Bank Common Sptial Pattern algorithm
%input:train_data, 3EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
%      train_label,train_data对应的标签
%      sampleRate,采样率
%               m,CSP-m参数
%output:features_train 融合后各子频带后的特征数组
%       projMAll 由各子频带计算所得的投影矩阵
%       classNum 待分类的类别数量
function [features_train,projM_All,classNum]=FBCSP(train_data,train_label,sampleRate,m,freq)
[q,p,k]=size(train_data);   %获取总的trial次数
%% acquire and combine feature of different frequency bands
features_train=[];          %声明训练集csp特征融合数组
filter_data=zeros(size(train_data));
classNum=max(train_label);  %获取类别数量
projM_All=zeros(p,p,max(train_label)*(size(freq,2)-1)); %申请投影矩阵空间
for i=1:size(freq,2)
    lower=freq(i);  %获取低频
    if lower==freq(size(freq,2))
        break;
    end
    higher=freq(i+1);%获取高频
    %对各子频带进行滤波
    filter_tmp=[];
    for j=1:k   %对每个trial进行循环滤波,filter()函数可以滤波3维数据?
        filter_tmp=filter_param(train_data(:,:,j),lower,higher,sampleRate,4);
        filter_data(:,:,j)=filter_tmp;
    end
    % 计算csp滤波器,用csp滤波器进行特征提取
    projM=cspProjMatrix(filter_data,train_label); %要循环保存投影矩阵用于在线CSP滤波
    projM_All(:,:,1+(i-1)*classNum:i*classNum)=projM;   %存储当前频带投影矩阵
    feature=[];  %声明本子频带特征矩阵
    for b=1:k    %循环提取特征
        feature(b,:)=cspFeature(projM,filter_data(:,:,b),m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
    end
    tmp_data=feature;
    features_train=[features_train,tmp_data]; %拼接各频带特征矩阵
end

FBCSPOnline.m函数

%author:mao date:2020-10-8
%programme:the Filter Bank Common Sptial Pattern algorithm
%input:train_data,3EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
%                 2EEG数据。其中,第一位是采样点,第二维是通道数量
%      projMAll,  由训练集计算所得个子频带CSP投影矩阵
%      classNum,  待分类的类别数
%      sampleRate,采样率
%               m,CSP的m参数
%output:features, 融合后各子频带后的特征数组
function features_train=FBCSPOnline(train_data,projMAll,classNum,sampleRate,m,freq)
if ndims(train_data)==3 %输入EEG数据为3%% acquire and combine feature of different frequency bands
    [q,p,k]=size(train_data);%获取总的trial次数
    filter_data=zeros(size(train_data));
    features_train=[];      %声明训练集csp特征融合数组
    for i=1:size(freq,2)
        lower=freq(i);  %获取低频
        if lower==freq(size(freq,2))
            break;
        end
        higher=freq(i+1);%获取高频
        %对各子频带进行滤波
        filter_tmp=[];
        for j=1:k   %对每个trial进行循环滤波,matlab中的filter()函数可以滤波3维数据?
            filter_tmp=filter_param(train_data(:,:,j),lower,higher,sampleRate,4);
            filter_data(:,:,j)=filter_tmp;
        end
        feature=[];  %声明本子频带特征矩阵
        for b=1:k    %循环提取特征
            feature(b,:)=cspFeature(projMAll(:,:,1+(i-1)*classNum:i*classNum),filter_data(:,:,b),m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
        end
        tmp_data=feature;
        features_train=[features_train,tmp_data]; %拼接个自频带特征矩阵
    end
else                  
    %% 输入EEG数据为2维
    features_train=[];      %声明训练集csp特征融合数组
    for i=1:size(freq,2)
        lower=freq(i);  %获取低频
        if lower==freq(size(freq,2))
            break;
        end
        higher=freq(i+1);%获取高频
        %对各子频带进行滤波
        filter_data=filter_param(train_data,lower,higher,sampleRate,4);
        feature=[];  %声明本子频带特征矩阵
        feature=cspFeature(projMAll(:,:,1+(i-1)*classNum:i*classNum),filter_data,m); %第三个参数m不要超过通道数的一半,不然会出现重复特征
        tmp_data=feature';
        features_train=[features_train,tmp_data]; %拼接个自频带特征矩阵
    end
end

filter_param.m滤波函数


%% 对数据进行滤波
%输入:data 待滤波EEG数据
%   low        高通滤波参数设置
%   high       低通滤波参数设置
%   sampleRate          采样率
%   filterorder  butterworth滤波器阶数
%返回:filterdata       滤波后EEG数据
function filterdata=filter_param(data,low,high,sampleRate,filterorder)
%% 设置滤波参数
 filtercutoff = [low*2/sampleRate high*2/sampleRate]; 
 [filterParamB, filterParamA] = butter(filterorder,filtercutoff);
 filterdata= filter( filterParamB, filterParamA, data);

cspProjMatrix.m (计算CSP滤波器)

function projM=cspProjMatrix(x,y)
%基于共空间模式算法计算出一个投影矩阵
%输入参数:
%        x:3EEG数据。其中,第一维是采样点,第二维是通道数量,第三维度是trials大小
%        y: 一维列向量标签 范围是从1到分类数量,长度与x的第三维保持一致
%注意:这里y标签只能从1开始,往后延,不能用-1 1这种标签格式

trialNo=length(y); %获取标签长度
classNo=max(y);    %获取标签类别数量
channelNo=length(x(1,:,1)); %获取通道数量

for k=1:classNo    %对每一类进行训练
    N_a=sum(y==k); %number of trials for class k,当前类的trials数量
    N_b=trialNo-N_a;
    R_a=zeros(channelNo,channelNo); %申请[通道数量*通道数量] 方阵大小的空间
    R_b=zeros(channelNo,channelNo);
    for i=1:trialNo
        R=x(:,:,i)'*x(:,:,i); 
        %R=cov(x(:,:,i)); 
        R=R/trace(R);
        if y(i)==k   %当前类
            R_a=R_a+R;
        else         %其他类
            R_b=R_b+R;
        end
    end
    R_a=R_a/N_a;
    R_b=R_b/N_b;
    [V,D]=svd(R_a+R_b);  %矩阵奇异值分解
    W=D^(-0.5)*V';       %P白化矩阵,P矩阵返回为W
    S_a=W*R_a*W';
    [V,D]=svd(S_a);
    projM(:,:,k)=W'*V;  %投影矩阵, 最后投影矩阵的大小为 [通道数量 通道数量 类别数量] 其中第三维度为每个类的滤波器
end 

cspFeature.m (利用CSP滤波器进行过滤)

function feature=cspFeature(projM,x,m)
%%%%%%通过投影矩阵进行特征提取
% 输入参数:
%      projM: csp投影矩阵
%          x: 一个时间窗口的2EEG数据。其中,第一维是采样点;第二维是通道
%          m: 投影数据矩阵的第一列和最后一列的个数。
% 输出参数:
%    feature: 从列向量中提取到的特征


classNo=length(projM(1,1,:));  %获取类别数量
channelNo=size(x,2);           %获取通道数量
feature=[];                    %声明特征矩阵
for k=1:classNo                %classNo为类数量
    Z=x*projM(:,:,k); %projected data matrix
    for j=1:m
        feature=[feature; var(Z(:,j)); var(Z(:,channelNo-j+1))];  %var(A) 算矩阵A没列方差,此时默认是除N-1
        %variances of the first and last m columns(1和最后m列的方差)
    end
end
feature=log(feature/sum(feature)); 

all_MuI.m (对输入的特征矩阵进行Mutual Information特征选择)

%author:mao date:2020-1203 
%function:Mutual Information
%   input:fea_train(m*n), features that needs to culculate MI.
%         label_train(m*1),label that conresponds the features
%
%  output:rank(n*2),the first dimension includes the Mutual information 
%                   values,and the second dimension incoude the index
function sort_tmp=all_MuI(fea_train,label_train)
n=size(fea_train,1);               
tmp=[];
for i=1:size(fea_train,2)
    MuI=calc_MuI(fea_train(:,i),label_train,n);
    tmp=[tmp;MuI i];                  
end
sort_tmp=sortrows(tmp,'descend');

calc_MuI.m(计算两列的互信息)

%计算两列向量之间的互信息
%u1:输入计算的向量1
%u2:输入计算的向量2
%wind_size:向量的维度
function mi = calc_MuI(u1, u2, wind_size)
x = [u1, u2];
n = wind_size;
[xrow, xcol] = size(x);
bin = zeros(xrow,xcol);
pmf = zeros(n, 2);
for i = 1:2
    minx = min(x(:,i));
    maxx = max(x(:,i));
    binwidth = (maxx - minx) / n;
    edges = minx + binwidth*(0:n);
    histcEdges = [-Inf edges(2:end-1) Inf];
    [occur,bin(:,i)] = histc(x(:,i),histcEdges,1); %通过直方图方式计算单个向量的直方图分布
    pmf(:,i) = occur(1:n)./xrow;
end
%计算u1和u2的联合概率密度
jointOccur = accumarray(bin,1,[n,n]);  %(xi,yi)两个数据同时落入n*n等分方格中的数量即为联合概率密度
jointPmf = jointOccur./xrow;
Hx = -(pmf(:,1))'*log2(pmf(:,1)+eps);
Hy = -(pmf(:,2))'*log2(pmf(:,2)+eps);
Hxy = -(jointPmf(:))'*log2(jointPmf(:)+eps);
MI = Hx+Hy-Hxy;
mi = MI/sqrt(Hx*Hy);

参考文献

[1] Ang K K , Chin Z Y , Zhang H , et al. Filter Bank Common Spatial Pattern (FBCSP) in Brain-Computer Interface[C]// IEEE International Joint Conference on Neural Networks. IEEE, 2008.

1, calc_MuI.m计算来自以下博客的代码
https://blog.csdn.net/m_buddy/article/details/72818227

2, CSP提取出来的特征个数为4m维度的问题
   这里感谢weixin_45676590用户提出的问题,这里确实是我不够细心了。因为这里的CSP的特征提取算法(cspProjMatrix.m文件)是面向多分类问题的,CSP本来是处理二分类问题的,这里的多分类CSP采用的是一对多策略实现对二分类CSP的扩展,也就是说假如有A,B,C,D四个类别采用一对多策略进行多分类CSP特征提取的话,需要计算四个投影矩阵W1,W2,W3,W4,如下:
在这里插入图片描述

   很明显,这里的做法就是有多少个分类就生成多少个CSP的投影矩阵,但当分类数目为2时(即做二分类CSP),很明显这里会生成两个投影矩阵,如下
在这里插入图片描述

   很明显,这里A vs B 和 B vs A 生成的投影矩阵是一样的,这也就是为什么造成二分类特征数为4m的原因,因为代码中的二分类情况下的CSP投影矩阵被重复计算了,引起了不必要的冗余。
解决
   既然知道了原因,那么解决就容易了,一个比较粗暴的做法是可以在计算投影矩阵(cspProjMatrix.m)前先判断是否为二分类,若是二分类则另外处理,pass掉计算重复矩阵即可。

            (帮我点个免费的赞再走吧~
  • 124
    点赞
  • 156
    收藏
    觉得还不错? 一键收藏
  • 46
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 46
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值