Random Walk， Markov Chain_马尔科夫随机游走-CSDN博客

本文链接：https://blog.csdn.net/DLtoRick/article/details/83717555

文章目录

一、基础
二、图上的随机游走 RW on Graph

一、基础

什么是随机过程
什么是马尔可夫链
什么是随机游走
什么是图上的随机游走，与随机游走的区别

什么是随机过程

对比：确定过程研究某个量随时间的变化；随机过程研究某个量随时间的可能变化，每个时刻变化的方向（取值）不确定。
定义：由一系列随机变量组成。每一个时刻系统的状态都由一个随机变量表示，而整个过程则构成态空间的一个轨迹（随机过程的实现）。一个随机过程最终实现，会得到一组随时间变化的数值（状态态空间里的轨迹），实践中我们都是从数据结果中推测一个随机过程的性质的。
意义：概率是建立在可重复性上，是一个理想模型，而建立在此上的随机过程就更是一个理想化的模型，它暗含的是历史可无限重复，然后你把他们收集在一起。
复杂性：这是一个高维问题，因为一个随机过程具有无限多可能性。试想象一个最简单的随机过程，这个过程由N步组成，每一步都有两个选择（0，1），那么可能的路径就有2的N次方个，这个随机过程就要由2^N-1个概率来描述(-1是因为已知概率和为1)。

什么是马尔可夫过程

未来所处的状态仅与其当前状态有关，而与过去的状态无关的随机过程。因为当前状态本来就包含了过去状态信息。

什么是马尔可夫链 Markov Chain

是一种满足马尔可夫性的数学模型。用条件概率体现马尔可夫性。n为时间。
$Pr(X_{n+1}=x_{n+1} | X_1=x_1, ..., X_n=x_n)=Pr(X_{n+1}=x_{n+1} | X_n=x_n)$

什么是平稳分布/稳态 Stationary

每一步和前一步关系与时间无关。
$Pr(X_{n+1}=x_{n+1} | X_n=x_n)=Pr(X_n=x_n | X_{n-1}=x_{n-1})$

细致平衡条件 Detailed Balance

$\pi_ip_{ij}=\pi_jp_{ji}$
$\sum(\pi_ip_{ij})=\pi_j$
对于可逆Markov chian，状态分布 $\pi$ 为平稳分布， $\pi=\pi P$ ，P为转移矩阵

什么是随机游走 Random Walk

${X_n\}$ i.i.d.（独立同分布）， $S_0=0, S_n=\sum\limits_{i=1}^n(X_i), n>0,\{S_n, n>=0\}$ 称为随机游走过程.

简单随机游走（1维）

考虑整数轴上的随机游走：整数轴Z，起始点0，往左+1，往右-1，每次移动等概率。

每次状态记为 $Z_j$ ，取值{-1, 1}，取值概率各为0.5。 $S_0=0，S_n=\sum(Z_j)$ ，序列 ${S_n\}$ 称为整数轴上的random walk
和Markov chain联系：状态i看作当前所在的整数， $P_{i,i+1}=1-P_{i,i-1}$
推广到图上，一般是Markov的形式。

t0	t1	t2	t3	随机变量~分布
Z0=0	Z1=+1	Z2=+1	Z3=-1	动作Zi~(离散型均匀分布，取值{-1,1}，概率均为1/2)
S0=0	S1=1	S2=2	S3=1	位置结果Si，序列{Si}为random walk
X0=0	X1=1	X2=2	X3=1	状态Xi~(离散型均匀分布，取值为上一时刻的邻域，概率均为 $1/d(X_{i-1})$ ，整数轴上图的度d=2)

二、图上的随机游走 RW on Graph

在图上：有限的Markov chain
在有向图上：带边权的Markov chain
在无向图上：time-reversible的Markov chain
在对称无向图上：对称Markov chain

1. Basic notions and facts (Markov Chain)

$G = (V, E)$ 为connected的，m条边，n个节点； $v_t$ 为t时刻随机游走到的节点，序列 ${v_t,t=0,1,...\}$ 为马尔可夫链

转移概率矩阵 M
$M=(p_{ij})$
$i到j的转移概率p_{ij}=\left\{ \begin{aligned} 1/d(i) &,& 若ij属于E\\ 0 &,& else \end{aligned} \right.$
对角矩阵 D
$D)_{ii}=1/d(i)$ ， G为d-regular时，d为常数， $D)_{ii}=1/d$
邻接矩阵 A
三者关系是 $M=DA_G$
状态矩阵 P（概率分布/Markov模型）
$P_{t+1}=M^TP_t$ ， $P_{t}=(M^T)^tP_0$ ，t时刻分布和转移概率决定下一时刻分布
其中 $P_t(i)=Prob(v_t=i)$ ，是t时刻在点i的概率
$M^t)_{ij}=p_{ij}^t$ ，幂次相乘后矩阵的元素为经过t步从i->j的概率
平稳分布(stationary distribution) $\pi$
$P_1=P_0$ ，即 $P_t=P_0，t\ge 0$ ，则 $P_0$ 是stationary的
$\pi(v)=d(v)/(2m)$ ，对每个v，d(v)固定，不随时间变化；当G为regular，即d(v)=d时， $\pi$ 为均匀分布。证明 $\pi为平稳分布$
- 平稳分布是唯一的
- 平稳分布的存在性：well-behaved graph 总是存在
- G非二分图(non-bipartite)，则 $t\to\infty$ ， $v_t$ 的分布收敛于平稳分布
时间可逆(time-reversibility)
$\pi(i)p_{ij}=\pi(j)p_{ji}$ ， $\pi(i)p_{ij}=d(i)/(2m)*1/d(i)=1/(2m)$ ，即沿着任意一条边转移的频率相等
从边随机游走回到该边的步数期望值为2m，从节点i随机游走回到i的步数期望值是 $1/\pi(i)=2m/d(i)$ ，若G是regular的，return time则为n，即节点个数。
well-behaved graph
- 不可约(irreducible)/strongly connected：每一个状态都可来自任意其它状态。图上任意两点可达。
- 非周期(aperiodic)：周期性是存在至少一个状态经过一个固定的时间段后连续返回；非周期的图所有的cycle边数的最大公约数为1
- 不可约、非周期的Markov chain最大特征值为1且为单(重数为1)，其他特征值绝对值均小于1
- 故存在唯一平稳分布： $\pi=1\pi=M^T\pi$
Markov chain 的特征值
$M$ 为Markov chain，证明 $M^t$ 为Markov chain， $(M^T)^tx=\lambda^t x$ ，有限，因为 $M_{ij}\le1$ (概率)，若存在 $|\lambda|>1$ 则其趋于无穷，矛盾。证明见：线代随笔10-马尔科夫矩阵的性质与估计

2. Main parameters

access time or hitting time
$H (i, j)$ 从i到j步数期望值，不是对称的
$H(i,j)=\sum\limits_{t>0} tp_{ij}^t$
commute time
$\kappa(i, j)=H(i,j)+H(j,i)$ ，从i经j回到i的步数期望值，是对称的
cover time
遍历所用步数期望值
mixing rate
$\mu=\lim\limits_{t\to\infty}\sup\max|p_{ij}^{(t)}- d_j/(2m)|^{1/t}$ ，当G为非二分图， $p_{ij}^{(t)}\to d_j/(2m),t\to\infty$ 。衡量序列从初始分布经过随机游走(乘转移矩阵)到平稳分布的收敛速度。注意区分 $p_{ij}^t,p_{ij}^{(t)}$
- mixing time

Symmetry and access time

【以下未完】

3. The eigenvalue connection

G不regular，M非对称，如何转化？
由 $M = D A$ 得对称矩阵 $N=D^{1/2}AD^{1/2}=D^{-1/2}MD^{1/2}$ ，特征值同M
特征分解得 $N=\sum\limits_{k=1}^n\lambda_kv_kv_k^T$ ， $v_k$ 为单位长度特征向量，注意区分 $v_k,v_t$
以证明随机游走收敛性【截图】