递归定量分析(RQA)详解

DuHz

于 2025-04-30 18:39:16 发布

阅读量764

点赞数 20

文章标签：算法机器学习人工智能信号处理信息与通信

本文链接：https://blog.csdn.net/qq_44648285/article/details/147638352

版权

递归定量分析(RQA)详解

1. 引言

递归定量分析(Recurrence Quantification Analysis, RQA)是一种用于分析非线性动力系统的强大工具，它能够量化系统中的重复模式和结构特征。这种方法最初由Zbilut和Webber于1992年提出，随后由Marwan等人进一步扩展和完善。RQA是建立在递归图(Recurrence Plot, RP)基础上的定量分析方法，通过将递归图中的各种结构特征量化，从而揭示动力系统的内在特性。

2. 递归图的基本原理

2.1 庞加莱回复性定理

递归图的理论基础可以追溯到庞加莱回复性定理。该定理指出：在一定的条件下，系统的某个状态在经过充分长的时间后，将回到初始状态附近。数学上，对于一个哈密顿系统，几乎所有的轨道都是回复的，即对于相空间中的任意区域 $\Omega$ ，几乎所有从 $\Omega$ 出发的轨道都会无限多次地返回该区域。

形式化表述为：对于相空间 $\mathcal{M}$ 中的一个点 $\mathbf{x}$ ，如果它所在轨道是回复的，则对于任意 $\varepsilon > 0$ ，存在无穷多个时间点 $\{t_k\}_{k=1}^{\infty}$ ，使得：

$\|\mathbf{x}(t_k) - \mathbf{x}\| < \varepsilon, \quad k = 1, 2, \ldots, \infty$

其中， $\mathbf{x}(t)$ 表示从 $\mathbf{x}$ 出发，经过时间 $t$ 后的系统状态。

2.2 相空间重构

构造递归图的关键步骤是进行相空间重构。相空间重构基于嵌入理论，其核心是Takens嵌入定理。

2.2.1 Takens嵌入定理

对于一个 $d$ 维动力系统：

$\frac{d\mathbf{x}}{dt} = \mathbf{F}(\mathbf{x}), \quad \mathbf{x} \in \mathbb{R}^d$

假设我们只能观测到一个标量时间序列 ${s(t_i)\}_{i=1}^N$ ，Takens定理指出，在一定条件下，我们可以通过时间延迟坐标法重构一个与原系统拓扑等价的相空间。具体来说，如果原系统的吸引子维数为 $d_A$ ，则对于几乎所有的光滑观测函数 $\mathbb{R}^d \rightarrow \mathbb{R}$ ，重构向量：

$\mathbf{y}(t) = [s(t), s(t-\tau), s(t-2\tau), \ldots, s(t-(m-1)\tau)]$

形成的 $m$ 维相空间（其中 $\geq 2d_A + 1$ ， $\tau$ 为时间延迟）与原系统的吸引子在拓扑上是等价的，即存在一个微分同胚 $\Phi: \mathcal{A} \rightarrow \mathcal{A}'$ ，将原系统的吸引子 $\mathcal{A}$ 映射到重构空间中的吸引子 $\mathcal{A}'$ 。

2.2.2 延迟坐标法的数学表述

给定时间序列 ${s(t_i)\}_{i=1}^N$ ，重构的相空间向量为：

$\mathbf{y}(t_i) = [s(t_i), s(t_i-\tau), s(t_i-2\tau), \ldots, s(t_i-(m-1)\tau)]^T$

其中， $(m-1)\tau+1, (m-1)\tau+2, \ldots, N$ ， $\tau$ 是时间延迟， $m$ 是嵌入维度。

重构的相空间轨道可以表示为一个矩阵：

$\mathbf{Y} = \begin{bmatrix} s(t_{(m-1)\tau+1}) & s(t_{(m-1)\tau+1-\tau}) & \cdots & s(t_{(m-1)\tau+1-(m-1)\tau}) \\ s(t_{(m-1)\tau+2}) & s(t_{(m-1)\tau+2-\tau}) & \cdots & s(t_{(m-1)\tau+2-(m-1)\tau}) \\ \vdots & \vdots & \ddots & \vdots \\ s(t_N) & s(t_N-\tau) & \cdots & s(t_N-(m-1)\tau) \end{bmatrix}$

2.3 最优嵌入参数的确定

2.3.1 时间延迟的确定

时间延迟 $\tau$ 的选择对相空间重构的质量有重要影响。太小的 $\tau$ 会导致重构向量的分量高度相关，太大的 $\tau$ 则可能导致分量之间失去关联。通常使用以下方法确定最优时间延迟：

互信息法：最优时间延迟 $\tau_{opt}$ 是互信息函数 $I(\tau)$ 的第一个局部极小值：

$I(\tau) = \sum_{i,j} p_{ij}(\tau) \log_2 \frac{p_{ij}(\tau)}{p_i p_j}$

其中， $p_i$ 是信号值落在第 $i$ 个区间的概率， $p_j$ 是信号值落在第 $j$ 个区间的概率， $p_{ij}(\tau)$ 是信号值在时间 $t$ 落在第 $i$ 个区间且在时间 $t+\tau$ 落在第 $j$ 个区间的联合概率。

自相关函数法：最优时间延迟 $\tau_{opt}$ 是自相关函数 $C(\tau)$ 首次降到 $1/ e$ 或首次过零点的时间：

$C(\tau) = \frac{\sum_{i=1}^{N-\tau} (s(t_i) - \bar{s})(s(t_{i+\tau}) - \bar{s})}{\sum_{i=1}^{N} (s(t_i) - \bar{s})^2}$

其中， $\bar{s}$ 是时间序列的平均值。

Theiler窗口：为了避免时间相关性带来的假递归，通常使用Theiler窗口 $w$ 排除主对角线附近的点：

$\geq \tau_{decorr}$

其中， $\tau_{decorr}$ 是序列的装饰时间，通常取为自相关函数首次降到零的时间。

2.3.2 嵌入维度的确定

嵌入维度 $m$ 的选择也是相空间重构的关键。理论上， $\geq 2d_A + 1$ 足以确保重构的拓扑等价性，但在实际应用中，我们通常不知道吸引子的真实维数 $d_A$ 。常用的确定嵌入维度的方法是假近邻法(False Nearest Neighbors, FNN)：

对于每个点 $\mathbf{y}_i^{(m)}$ 在 $m$ 维相空间中，找到其最近邻点 $\mathbf{y}_j^{(m)}$ 。
计算它们在 $m + 1$ 维空间中的距离变化率：

$R_i^{(m)} = \frac{\|\mathbf{y}_i^{(m+1)} - \mathbf{y}_j^{(m+1)}\|^2 - \|\mathbf{y}_i^{(m)} - \mathbf{y}_j^{(m)}\|^2}{\|\mathbf{y}_i^{(m)} - \mathbf{y}_j^{(m)}\|^2}$

如果 $R_i^{(m)} > R_{thr}$ （通常取 $R_{thr} = 10$ ），则称点 $\mathbf{y}_i^{(m)}$ 和 $\mathbf{y}_j^{(m)}$ 为假近邻。
计算假近邻点的比例：

$\frac{1}{N-(m+1)\tau} \sum_{i=1}^{N-(m+1)\tau} \Theta(R_i^{(m)} - R_{thr})$

其中， $\Theta$ 是Heaviside函数。

最优嵌入维度 $m_{opt}$ 是使 $FNN (m)$ 首次降到一个很小值（如1%）的最小 $m$ 值。

2.4 递归图的构造

当我们完成相空间重构后，即可构造递归图。递归图反映的是重构相空间中状态向量之间的距离关系。

$\textbf{定义}$ ：给定相空间轨道 $\{\mathbf{y}_i\}_{i=1}^M$ 和阈值 $\varepsilon$ ，递归图的数学定义为一个二维二值矩阵 $\mathbf{R}$ ：

$R_{i,j}(\varepsilon) = \Theta(\varepsilon - \|\mathbf{y}_i - \mathbf{y}_j\|), \quad i,j = 1, 2, \ldots, M$

其中：

$\Theta(\cdot)$ 是Heaviside阶跃函数
$\|\cdot\|$ 是范数，通常使用欧几里得范数、最大范数或曼哈顿范数
$(m-1)\tau$ 是重构相空间中的点数

为了考虑动力系统的时间相关性，通常使用Theiler窗口 $w$ 来排除主对角线附近的点，修正的递归图定义为：

$R_{i,j}^{(w)}(\varepsilon) = \Theta(\varepsilon - \|\mathbf{y}_i - \mathbf{y}_j\|) \cdot \Theta(|i-j| - w), \quad i,j = 1, 2, \ldots, M$

阈值 $\varepsilon$ 的选择对递归图的结构有重要影响。常用的选择方法包括：

固定百分比：选择 $\varepsilon$ 使递归点的比例为相空间体积的一个固定百分比（通常为1%-5%）。
标准差的倍数： $\varepsilon = k \cdot \sigma$ ，其中 $\sigma$ 是相空间点坐标的标准差， $k$ 通常取0.1-0.5。
基于FAN算法：通过最大化递归图中斜线结构的比例来选择最优 $\varepsilon$ 。

3. 递归定量分析(RQA)方法

递归图虽然直观地展示了系统状态的递归特性，但它只能进行定性分析。递归定量分析(RQA)通过引入一系列统计量，对递归图中的结构特征进行定量分析，从而揭示系统的动力学性质。

3.1 RQA的基本参数

3.1.1 递归率(RR)

递归率(Recurrence Rate)是递归点在递归图中的密度，定义为：

$\frac{1}{M^2} \sum_{i,j=1}^{M} R_{i,j}(\varepsilon) = \frac{1}{M^2} \sum_{i,j=1}^{M} \Theta(\varepsilon - \|\mathbf{y}_i - \mathbf{y}_j\|)$

递归率与递归图中黑点的百分比相对应，它反映了系统状态递归的总体水平。考虑到Theiler窗口 $w$ 的影响，修正的递归率为：

$RR^{(w)} = \frac{1}{M(M-w)} \sum_{i=1}^{M} \sum_{j=i+w}^{M} R_{i,j}(\varepsilon)$

3.1.2 对角线结构分析

递归图中的对角线结构对应于相空间轨道的平行段，反映了系统的确定性和可预测性。对角线的分布可以通过直方图 $P (l)$ 来表示，其中 $P (l)$ 是长度为 $l$ 的对角线的数量。

$\textbf{定义}$ ：对角线是递归图中平行于主对角线的连续递归点，满足：

$R_{i,j}(\varepsilon) = 1, \quad R_{i-1,j-1}(\varepsilon) = 0, \quad R_{i+l,j+l}(\varepsilon) = 0, \quad \text{and} \quad R_{i+k,j+k}(\varepsilon) = 1 \quad \forall k \in \{0, 1, \ldots, l-1\}$

基于对角线分布，可以计算一系列RQA参数：

确定性(DET)：形成对角线结构的递归点占总递归点的比例（通常只考虑长度不小于 $l_{min}$ 的对角线， $l_{min}$ 通常取2）：

$\frac{\sum_{l=l_{min}}^{M} l \cdot P(l)}{\sum_{i,j=1}^{M} R_{i,j}(\varepsilon)}$

确定性反映了系统行为的可预测性。随机系统的递归图中几乎只有分散的点，而确定性系统的递归图中包含较多的对角线。

平均对角线长度(L)：对角线的平均长度：

$\frac{\sum_{l=l_{min}}^{M} l \cdot P(l)}{\sum_{l=l_{min}}^{M} P(l)}$

平均对角线长度反映了系统状态相似性持续的平均时长，与系统的可预测时间相关。

最大对角线长度(Lmax)：最长对角线的长度（主对角线除外）：

$L_{max} = \max(\{l_i\}_{i=1}^{N_l})$

其中， ${l_i\}_{i=1}^{N_l}$ 是所有对角线的长度集合， $N_l$ 是对角线的总数。

发散度(DIV)：最大对角线长度的倒数：

$\frac{1}{L_{max}}$

发散度与系统的最大Lyapunov指数相关，表征了系统的混沌程度。

对角线熵(ENTR)：对角线长度分布的Shannon熵：

$-\sum_{l=l_{min}}^{M} p(l) \ln p(l)$

其中， $\frac{P(l)}{\sum_{l=l_{min}}^{M} P(l)}$ 是长度为 $l$ 的对角线的概率分布。

对角线熵反映了系统动力学的复杂性和不确定性。

趋势(TREND)：递归图中递归点密度随离主对角线距离变化的趋势：

$\frac{\sum_{k=1}^{\tilde{N}} k \cdot \left<\mathbf{R}_{i,i+k}\right>_i - \frac{\tilde{N}(\tilde{N}+1)}{4} \cdot \sum_{k=1}^{\tilde{N}} \left<\mathbf{R}_{i,i+k}\right>_i}{\sum_{k=1}^{\tilde{N}} k^2 - \frac{\tilde{N}^2(\tilde{N}+1)^2}{4}}$

其中， $\left<\mathbf{R}_{i,i+k}\right>_i = \frac{1}{M-k} \sum_{i=1}^{M-k} R_{i,i+k}(\varepsilon)$ 是距主对角线 $k$ 个单位的对角线上递归点的密度， $\tilde{N}$ 是考虑的最大距离。趋势反映了系统的非平稳性程度。对于平稳系统， $\approx 0$ ；对于非平稳系统， $TREN D$ 的绝对值较大。

3.1.3 垂直结构分析

递归图中的垂直（或水平）结构对应于系统状态的持续性或间歇性，反映了系统的粘滞性。垂直线的分布可以通过直方图 $P (v)$ 来表示，其中 $P (v)$ 是长度为 $v$ 的垂直线的数量。

$\textbf{定义}$ ：垂直线是递归图中垂直于主对角线的连续递归点，满足：

$R_{i,j}(\varepsilon) = 1, \quad R_{i,j-1}(\varepsilon) = 0, \quad R_{i,j+v}(\varepsilon) = 0, \quad \text{and} \quad R_{i,j+k}(\varepsilon) = 1 \quad \forall k \in \{0, 1, \ldots, v-1\}$

基于垂直线分布，可以计算一系列RQA参数：

层状度(LAM)：形成垂直线结构的递归点占总递归点的比例（通常只考虑长度不小于 $v_{min}$ 的垂直线， $v_{min}$ 通常取2）：

$\frac{\sum_{v=v_{min}}^{M} v \cdot P(v)}{\sum_{i,j=1}^{M} R_{i,j}(\varepsilon)}$

层状度反映了系统状态变化的平缓程度，与系统的间歇性相关。

捕获时间(TT)：垂直线的平均长度：

$\frac{\sum_{v=v_{min}}^{M} v \cdot P(v)}{\sum_{v=v_{min}}^{M} P(v)}$

捕获时间反映了系统在特定状态下停留的平均时长，与系统的粘滞性相关。

最大垂直线长度(Vmax)：最长垂直线的长度：

$V_{max} = \max(\{v_i\}_{i=1}^{N_v})$

其中， ${v_i\}_{i=1}^{N_v}$ 是所有垂直线的长度集合， $N_v$ 是垂直线的总数。

垂直线熵(VENTR)：垂直线长度分布的Shannon熵：

$-\sum_{v=v_{min}}^{M} p(v) \ln p(v)$

其中， $\frac{P(v)}{\sum_{v=v_{min}}^{M} P(v)}$ 是长度为 $v$ 的垂直线的概率分布。

垂直线熵反映了系统间歇性的复杂程度。

3.1.4 递归周期密度熵(RPDE)

递归周期密度熵是一种归一化的信息熵，用于量化系统中周期结构的规律性：

$\frac{H(P(l))}{H_{max}} = \frac{-\sum_{l=l_{min}}^{M} p(l) \ln p(l)}{\ln(L_{max} - l_{min} + 1)}$

其中， $H_{max} = \ln(L_{max} - l_{min} + 1)$ 是均匀分布情况下的最大熵值。

$RP D E$ 的值在0到1之间： $RP D E = 0$ 表示系统是完全周期的， $RP D E = 1$ 表示系统是完全随机的。

3.1.5 递归时间(RT)和递归周期(RP)

递归时间是系统状态首次递归所需的时间，定义为：

$\min\{j > 0 : \|\mathbf{y}_{i+j} - \mathbf{y}_i\| < \varepsilon\}$

递归时间的统计特性可以通过递归时间直方图 $P (RT)$ 来分析，其中 $P (RT)$ 是递归时间为 $RT$ 的次数。

递归周期是递归时间的平均值：

$\langle RT \rangle = \frac{1}{M} \sum_{i=1}^{M} RT(i)$

对于周期系统，递归周期等于系统的周期；对于混沌系统，递归周期与系统的相关时间有关。

3.1.6 递归图上的转移概率

递归图可以视为一个马尔可夫过程，定义转移概率矩阵 $\mathbf{P}$ ：

$P_{i,j} = \frac{R_{i,j}}{\sum_{k=1}^{M} R_{i,k}}$

$P_{i,j}$ 表示系统从状态 $i$ 转移到状态 $j$ 的概率。通过分析转移概率矩阵的特征值和特征向量，可以获取系统动力学的更多信息。

3.2 RQA的多尺度扩展

3.2.1 多尺度递归图

多尺度递归图通过在不同时间尺度上构造递归图，揭示系统在不同尺度上的动力学特性。具体方法是先对原始时间序列进行粗粒化处理，然后在不同粗粒化尺度上构造递归图。粗粒化过程定义为：

$s_{\tau}^{(n)}(i) = \frac{1}{n} \sum_{j=(i-1)n+1}^{in} s(j)$

其中， $n$ 是粗粒化尺度， $s_{\tau}^{(n)}(i)$ 是第 $i$ 个粗粒化数据点。

多尺度递归图的数学定义为：

$R_{i,j}^{(n)}(\varepsilon) = \Theta(\varepsilon - \|\mathbf{y}_i^{(n)} - \mathbf{y}_j^{(n)}\|)$

其中， $\mathbf{y}_i^{(n)}$ 是在粗粒化尺度 $n$ 上重构的相空间向量。

3.2.2 多尺度RQA

多尺度RQA将RQA参数在不同粗粒化尺度上进行计算，形成RQA参数随尺度变化的曲线，从而揭示系统在不同时间尺度上的动力学特性。例如，多尺度确定性定义为：

$DET^{(n)} = \frac{\sum_{l=l_{min}}^{M^{(n)}} l \cdot P^{(n)}(l)}{\sum_{i,j=1}^{M^{(n)}} R_{i,j}^{(n)}(\varepsilon)}$

其中， $P^{(n)}(l)$ 是在粗粒化尺度 $n$ 上构造的递归图中长度为 $l$ 的对角线的数量， $M^{(n)}$ 是在该尺度上重构相空间中的点数。

3.3 联合递归图和交叉递归图

3.3.1 联合递归图(JRP)

联合递归图(Joint Recurrence Plot, JRP)用于分析两个或多个子系统之间的同步行为，定义为各个子系统递归图的逐点乘积：

$JR_{i,j}^{(1,2,...,d)}(\varepsilon_1, \varepsilon_2, ..., \varepsilon_d) = \prod_{k=1}^{d} R_{i,j}^{(k)}(\varepsilon_k) = R_{i,j}^{(1)}(\varepsilon_1) \cdot R_{i,j}^{(2)}(\varepsilon_2) \cdot ... \cdot R_{i,j}^{(d)}(\varepsilon_d)$

其中， $R_{i,j}^{(k)}(\varepsilon_k)$ 是第 $k$ 个子系统的递归图， $\varepsilon_k$ 是对应的阈值。

联合递归图中的点表示所有子系统同时发生递归的时刻，反映了子系统之间的同步程度。

3.3.2 交叉递归图(CRP)

交叉递归图(Cross Recurrence Plot, CRP)用于分析两个不同系统之间的相似行为，定义为：

$CR_{i,j}^{(1,2)}(\varepsilon) = \Theta(\varepsilon - \|\mathbf{y}_i^{(1)} - \mathbf{y}_j^{(2)}\|)$

其中， $\mathbf{y}_i^{(1)}$ 和 $\mathbf{y}_j^{(2)}$ 分别是第一个和第二个系统在相空间中的状态向量。

交叉递归图中的点表示两个系统状态相似的时刻，反映了两个系统之间的相互关系。

3.3.3 交叉递归定量分析(CRQA)

交叉递归定量分析(Cross Recurrence Quantification Analysis, CRQA)是对交叉递归图进行的定量分析，计算方法与RQA类似，但基于交叉递归图而非递归图。

例如，交叉确定性(CDET)定义为：

$\frac{\sum_{l=l_{min}}^{M} l \cdot P_{CR}(l)}{\sum_{i,j=1}^{M} CR_{i,j}^{(1,2)}(\varepsilon)}$

其中， $P_{CR}(l)$ 是交叉递归图中长度为 $l$ 的对角线的数量。

CRQA参数反映了两个系统之间的相似性、同步性和因果关系。

4. RQA的数学公式详解

4.1 递归图的几何解释

递归图可以通过几何学的角度来解释。设 $\mathcal{M}$ 是一个 $m$ 维流形，嵌入在 $\mathbb{R}^m$ 中， $\mathbf{x}(t)$ 是相空间轨道在时间 $t$ 的位置。定义 $\varepsilon$ -球为：

$B_{\varepsilon}(\mathbf{x}) = \{\mathbf{y} \in \mathbb{R}^m : \|\mathbf{y} - \mathbf{x}\| \leq \varepsilon\}$

则递归点 $R_{i,j} = 1$ 当且仅当 $\mathbf{x}(j) \in B_{\varepsilon}(\mathbf{x}(i))$ ，即时间 $j$ 的状态落在以时间 $i$ 的状态为中心的 $\varepsilon$ -球内。递归图实际上是描述了相空间轨道与自身的交会情况。对于具有不同动力学特性的系统，递归图呈现出不同的几何模式：

周期轨道：递归图呈现出规则的对角线结构。
拟周期轨道：递归图呈现出棋盘状的结构。
混沌轨道：递归图呈现出复杂但有一定结构的图案。
随机过程：递归图呈现出无规律的噪声状分布。

4.2 递归图的线性代数表示

递归图可以用矩阵形式表示，设 $\mathbf{Y}$ 是相空间轨道矩阵，每行对应一个重构的相空间向量：

$\mathbf{Y} = \begin{bmatrix} \mathbf{y}_1^T \\ \mathbf{y}_2^T \\ \vdots \\ \mathbf{y}_M^T \end{bmatrix}$

距离矩阵 $\mathbf{D}$ 的元素为：

$D_{i,j} = \|\mathbf{y}_i - \mathbf{y}_j\|$

递归矩阵 $\mathbf{R}$ 可以表示为：

$\mathbf{R} = \Theta(\varepsilon \cdot \mathbf{1} - \mathbf{D})$

其中， $\mathbf{1}$ 是全1矩阵，运算符 $\Theta$ 应用于矩阵的每个元素。

4.3 RQA参数的矩阵表示

RQA参数可以用矩阵表示形式表达，这样有助于理解其几何和代数意义。

4.3.1 递归率(RR)

递归率可以表示为递归矩阵 $\mathbf{R}$ 的元素平均值：

$\frac{1}{M^2} \sum_{i,j=1}^{M} R_{i,j} = \frac{1}{M^2} \|\mathbf{R}\|_F^2$

其中， $\|\mathbf{R}\|_F$ 是矩阵 $\mathbf{R}$ 的Frobenius范数。

4.3.2 确定性(DET)

定义对角线指示矩阵 $\mathbf{DL}$ ，其元素为：

$DL_{i,j} = \begin{cases} 1, & \text{if } R_{i,j} \text{ is part of a diagonal line of length } \geq l_{min} \\ 0, & \text{otherwise} \end{cases}$

则确定性可以表示为：

$\frac{\sum_{i,j=1}^{M} DL_{i,j} \cdot R_{i,j}}{\sum_{i,j=1}^{M} R_{i,j}} = \frac{\langle \mathbf{DL}, \mathbf{R} \rangle_F}{\|\mathbf{R}\|_F^2}$

其中， $\langle \mathbf{A}, \mathbf{B} \rangle_F = \sum_{i,j} A_{i,j} B_{i,j}$ 是矩阵 $\mathbf{A}$ 和 $\mathbf{B}$ 的Frobenius内积。类似地，可以定义垂直线指示矩阵 $\mathbf{VL}$ 和其他结构的指示矩阵，从而用矩阵表示形式表达所有RQA参数。