Note for ‘Transfer Learning: A Riemannian Geometry Framework With Applications to BCI‘

Y_蒋林志

已于 2022-03-15 22:09:11 修改

阅读量312

点赞数 3

分类专栏：文献阅读文章标签：机器学习算法数学生物信息学迁移学习

于 2021-07-07 00:51:33 首次发布

本文链接：https://blog.csdn.net/qq_37233260/article/details/118533140

版权

文献阅读专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

讲述一篇发表在IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING（生物医学工程期刊）的文章‘Transfer Learning: A Riemannian Geometry Framework With Applications to Brain–Computer Interfaces’（迁移学习:黎曼几何框架应用于脑机接口）

文章介绍

本文探讨了脑电背景下的迁移学习问题基于脑电图的脑机接口(BCI)分类。我们提出对每个对象的协方差矩阵进行仿射变换，以使它们相对于参考协方差矩阵居中，使来自不同对象的数据具有可比性。使用标准最小距离均值分类器和文献中最近发展的基于SPD流形上定义的密度函数(混合黎曼高斯分布)的概率分类器进行分类。

模型建立

A. SPD矩阵流形的基本概念

定义黎曼度量：
$\delta \left( P_1,P_2 \right) =\left\| \log \left( P_{1}^{-1/2}P_2P_{1}^{-1/2} \right) \right\| _F=\left( \sum_{i=1}^n{\mathrm{l}^2}\lambda _i \right) ^{1/2}$
其中λ1, . . . , λn为 $P_{1}^{-1/2}P_2P_{1}^{-1/2}$ 的特征值， $\delta \left( \cdot \,\,, \cdot \right)$ 有两种性质：

$\delta \left( P_{1}^{-1},P_{2}^{-1} \right) =\delta \left( P_1,P_2 \right)$
$\delta \left( C^TP_1C,C^TP_2C \right) =\delta \left( P_1,P_2 \right) \forall C\in GL(n)$

其中 $G L (n)$ 为可逆矩阵集合。

B. SPD矩阵集合的质心

已知一个SPD集合，其流形的几何均值（质心）需满足：
$\mathcal{G}\left( P_1,...,P_N \right) =\mathrm{arg}\min_{P\in P(n)} \sum_{i=1}^N{\delta ^2}\left( P_i,P \right)$

一个重要不变性质是:
$\mathcal{G}\left( C^TP_1C,...,C^TP_NC \right) =C^T\mathcal{G}\left( P_1,...,P_N \right) C \\ \forall C\in GL(n)$

C. SPD流形上的混合高斯分布

为了考虑一个概率模型，在 $P\left( n \right)$ 空间上引入了一类叫做黎曼高斯分布的概率分布，记作 $G\left( \bar{P},\sigma \right)$ ，取决于两个参数 $\bar{P}\in P\left( n \right) ,\sigma >0$ 。概率密度函数如下：
$f(P\mid \bar{P},\sigma )=\frac{1}{\zeta (\sigma )}\exp \left( -\frac{\delta ^2(P,\bar{P})}{\sigma ^2} \right)$
其中 $\zeta (\sigma )$ 是一个标准化函数。由此式子得知， $\bar{P}$ 的最大似然估计(MLE)与上式的质心重合。为了包括几种分布形状，我们考虑了黎曼高斯混合分布，其概率密度函数如下：
$f(P)=\sum_{m=1}^M{w_m}f\left( P\mid \bar{P}_m,\sigma _m \right) \\ s.t. \sum_{m=1}^M{w_m=1}$

其中的参数可以通过EM（Expectation-Maximization）算法来计算。这类分布将用于为 $P\left( n \right)$ 中的数据构建概率分类器。也就意味着这个分布的均值，方差，权值都是可以先计算出来的。

D. SPD流形中的分类技术

MDM（Minimum Distance to Mean）分类器定义为：给定K个类别和一个训练集的第k类的均值 $\widehat{C}(k)$
（质心），其中(k = 1, . . . , K)，根据分类规则，将一个新的 $C_i$ 分配到第k类：
$\widehat{k}=\mathrm{arg}\min_{k\in \{1,...,K\}} \left\{ d_R\left( C_i,\widehat{C}(k) \right) \right\}$
但是该算法考虑了新的 $C_i$ 到质心 $\widehat{C}(k)$ 的黎曼距离，却忽略了这组数据中方差的信息。由于参数σ编码在黎曼高斯分布，贝叶斯分类原理可以利用这种分布。那么提出了一种基于后验分布的分类准则：
$\widehat{k}=\mathrm{arg}\min_{k\in \{1,...,K\}} \left\{ \log \zeta (\widehat{\sigma }(k))+\frac{d_{R}^{2}\left( C_i,\widehat{C}(k) \right)}{2\widehat{\sigma }^2(k)} \right\}$

其中 $\widehat{\sigma }(k)$ 为第k类的方差。

BCI数据表示

A. 运动想象:数据建构

它包含9名受试者执行四种运动想象(右手、左手、脚和舌头想象运动)的脑电图数据。我们使用协方差矩阵定义为:
$C_{X_l}=\frac{1}{T-1}X_lX_{l}^{T}$

其中 $X_l\in \mathbb{R}^{n\times T}$ ，n为电极数，T为考虑评估样本协方差的时间窗的样本点数。

B. 事件相关电位：数据构建

数据集包含：实验对象观看一个屏幕，屏幕上有36个外星人交替闪烁。他们被要求在心里计算特定(已知)目标外星人闪光的次数。但是如果我们随机打乱一个特定试验的时间瞬间，它的协方差矩阵的估计就会发生变化。所以在这个框架中，我们不能简单地考虑协方差矩阵 $C_{X_l}$ ，具体来说我们考虑了ERP的平均反应：
$E=\frac{1}{\left| K^+ \right|}\sum_{l\in K^+}{X_l}\in \mathbb{R}^{n\times T}$

其中 $K^+$ 是目标试验组，建立增广矩阵：
$\widetilde{X}_l=\left[ \begin{array}{c} E\\ X_l\\ \end{array} \right] \in \mathbb{R}^{2n\times T}$

然后考虑维数为2n × 2n的增广协方差矩阵：
$\widetilde{C}_{\widetilde{X}_l}=\left[ \begin{matrix}{l} C_E& C_{EX_l}\\ C_{X_lE}& C_{X_l}\\ \end{matrix} \right]$

用于区分靶标和非靶标试验的相关信息被嵌入到块 $C_{EX_l}$ 中， $C_{X_lE}$ 是转置。

Y_蒋林志

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Note for ‘Transfer Learning: A Riemannian Geometry Framework With Applications to BCI‘

前言讲述一篇发表在IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING（生物医学工程期刊）的文章‘Transfer Learning: A Riemannian Geometry Framework With Applications to Brain–Computer Interfaces’（迁移学习:黎曼几何框架应用于脑机接口）文章介绍本文探讨了脑电背景下的迁移学习问题基于脑电图的脑机接口(BCI)分类。我们提出对每个对象的协方差矩阵进行仿射变换，以使它们相对于参
复制链接

扫一扫

专栏目录