EEG Feature Selection via Global Redundancy Minimization for Emotion Recognition 论文笔记

概述

提出了一种基于最小化全局冗余的特征提取算法(global redundancy minimization in orthogonal regression)。

研究动机

基于EEG的情绪识别研究大多使用低密度(小于128个通道)的EEG数据,如SEED [71]和DEAP[72]数据库。低密度脑电图的缺点是其空间分辨率差。随着脑电设备的发展,高密度脑电(超过 128个通道)因其高空间分辨率在情绪识别领域受到越来越多的关注 。与低密度脑电信号相比,高密度脑电信号可以为情绪识别任务提供更丰富的空间信息。但基于EEG的情绪识别数据 [16]、[17]的样本量小,高维EEG特征容易导致分类器过拟合和情识别性能差。

在现有的研究中[26],[47],高度相关特征的特征排名往往是几乎相等的,因为它们被认为对分类任务[26],[47]同样重要 。结果表明,在选取的特征子集中,得分最高的多个EEG 特征相互依赖、互为冗余[48]。由 冗余的EEG特征不能提供额外有用的 信息用于情绪识别,应该被去除[30]。

mRMR[20]和CMIM 方法[49]能在一定程度上最小化所选特征子集中的冗余信息。然而, 因为采用贪心策略评估特征相关性, 因此无法实现全局冗余最小化, 所选择的EEG特征子集不是最优输出 [47],[48]。

解决方案

针对这一问题,文章提出了一种新的EEG特征 选择方法,即基于正交回归的全局冗余最小化(GRMOR)。引入了一个全局冗余评估项来计算EEG特征与其他特征的冗余之和。该方法能有效地从全局角度识别冗余脑电信号 ,进而获得具有鉴别性的非冗余脑电信号特征子集。

GRMOR 方法 将全局冗余信息引入正交回归以准确评估冗余信息 高度相关的 EEG 特征之间的关系。 GRMOR 是最小化以下问题:
min ⁡ W , b , θ ∥ W T Θ X + b 1 n T − Y ∥ F 2 + λ θ T A θ  s.t.  W T W = I k , θ T 1 d = 1 , θ ≥ 0 \begin{aligned} &\min _{W, \mathbf{b}, \theta}\left\|W^{T} \Theta X+\mathbf{b} \mathbf{1}_{n}^{T}-Y\right\|_{F}^{2}+\lambda \boldsymbol{\theta}^{T} A \boldsymbol{\theta} \\ &\text { s.t. } W^{T} W=I_{k}, \boldsymbol{\theta}^{T} \mathbf{1}_{d}=1, \boldsymbol{\theta} \geq 0 \end{aligned} W,b,θminWTΘX+b1nTYF2+λθTAθ s.t. WTW=Ik,θT1d=1,θ0
其中,A为冗余特征矩阵(从公式上看像是一个魔改的余弦相似度,矩阵中的每个元素代表两个特征间的相似程度/冗余程度) ,W是正交约束的投影矩阵。 Θ \Theta Θ θ T 1 d = 1 , θ > 0 \theta^T1_d=1,\theta > 0 θT1d=1,θ>0是对角矩阵。
A i , j = ( B i , j ) 2 = ( f i T f j ∥ f i ∥ ∥ f j ∥ ) 2 A_{i, j}=\left(B_{i, j}\right)^{2}=\left(\frac{\mathbf{f}_{i}^{T} \mathbf{f}_{j}}{\left\|\mathbf{f}_{i}\right\|\left\|\mathbf{f}_{j}\right\|}\right)^{2} Ai,j=(Bi,j)2=(fifjfiTfj)2

{ f i = H x i T f j = H x j T \left\{\begin{array}{l} \mathbf{f}_{i}=H \mathbf{x}_{i}^{T} \\ \mathbf{f}_{j}=H \mathbf{x}_{j}^{T} \end{array}\right. {fi=HxiTfj=HxjT

H = I n − 1 n 1 n 1 n T H=I_{\mathrm{n}}-\frac{1}{n} \mathbf{1}_{n} \mathbf{1}_{n}^{T} H=Inn11n1nT

优化算法:

算法4.交替优化W(GPI[69]), Θ \Theta Θ

算法说明:先固定 Θ \Theta Θ优化W,使用GPI算法。再固定W,优化 Θ \Theta Θ,过程中使用了增广拉格朗日法对式子进行表换,通过算法3对 Θ \Theta Θ进行优化。

为什么可以解决

为了说明GRMOR方 从全局角度最小化冗余的机理,Eq.(11)中的全局冗余最小化项θ ta θ可以 转化为∑d i,j=1 Ai,jθi。GRMOR方法 首先采用基于正交 回归的误差最小项对EEG特征xi和xj的权重进行评分。Ai,j的 大值表示EEG特征xi与 xj高度相关。当θi > θj时,θj将变小到 使全局冗余项最小化。也就是说,当 向量xi和xj互为冗余时,在 迭代优化目标函数的过程中,θj的 值减小,θi的值保留。

上面是原文翻译,以下为个人复述:

因为A是不变的,当 A i , j A_{i,j} Ai,j的值很大时,证明两个特征高度相关,此时两个特征互为冗余,当 θ i > θ j \theta_i>\theta_j θi>θj的时候 θ j \theta_j θj会变小,从而在后期对特征进行排序,达到去冗余的目的。

实验

数据集

DEAP、SEED 、HDED。

DEAP:音乐诱发,32通道

SEED:视频诱发 ,62通道

HDED:文章自行采集的128通道数据,视频诱发。

**实验范式 **

在实验中,参与者被要求以一种舒适的方式放松地坐着,并保持长时间的注意力。每个实验对象依次观看12个电影片段。12个电影片段对应12个试验的脑电图数据,每个试验包括以下步骤:

(1)一个视频播放前5秒开始提示。

(2)一个电影片段3-5分钟的显示。

(3)观看电影后50秒内对性兴奋 和效价进行主观自我评价。

(4)下一段影片前15秒的短暂休息。实验过程如图1所示。共有12个试验,每个受试者的脑电图数据。脑电图记录由经验丰富的神经生理学专家进行检查。

实验流程

  • 数据处理:eeg数据经1 - 50hz带通滤波器预处理。然后进行独立成分分析以去除生理伪影。没有进行切分。
  • 数据特征:12种。EEG信号分为5个频率范围:delta频带(1- 4hz)、theta频带(4- 8hz)、alpha 频带(8- 13hz)、beta频带(13- 30hz)和gamma频带 (30- 50hz)[77]。

效果

在3个数据集中与其他9种常见的特征提取算法进行对比,取得最好结果。

局限性

在半监督以及无监督学习中不一定有效。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值