什么是马尔可夫模型

彬彬侠

已于 2024-12-02 17:05:14 修改

阅读量3k

点赞数 16

分类专栏：机器学习(笔记) 文章标签：马尔可夫模型 Markov 概率图模型机器学习人工智能

于 2024-12-02 16:43:22 首次发布

本文链接：https://blog.csdn.net/u013172930/article/details/144191047

版权

机器学习(笔记) 专栏收录该内容

360 篇文章

订阅专栏

马尔可夫模型（Markov Model）

马尔可夫模型是一种基于马尔可夫性假设的随机过程模型，用于描述系统在一系列状态间的转移行为。它是一种简单而有效的工具，广泛用于建模具有时间依赖性或序列性质的问题，如天气预测、语音识别、基因序列分析等。

1. 马尔可夫性假设

马尔可夫模型的核心是马尔可夫性假设，即：

系统的未来状态仅依赖于当前状态，与过去的历史状态无关。

用数学表示为：
$P(S_{t+1} \mid S_t, S_{t-1}, \dots, S_0) = P(S_{t+1} \mid S_t)$
其中：

$S_t$ 是系统在时间 $t$ 时的状态。
$S_{t+1}$ 是系统在时间 $t + 1$ 时的状态。

2. 马尔可夫模型的基本要素

状态集合（State Space）：
- 表示系统可能的状态，通常记为 $\{s_1, s_2, \dots, s_N\}$ 。
状态转移概率（State Transition Probability）：
- 表示从当前状态 $S_t = s_i$ 转移到下一个状态 $S_{t+1} = s_j$ 的概率：
  $P(S_{t+1} = s_j \mid S_t = s_i) = T_{ij}$
- 这些概率可以表示为一个状态转移矩阵：
  $\begin{bmatrix} T_{11} & T_{12} & \cdots & T_{1N} \\ T_{21} & T_{22} & \cdots & T_{2N} \\ \vdots & \vdots & \ddots & \vdots \\ T_{N1} & T_{N2} & \cdots & T_{NN} \end{bmatrix}$
  其中 $T_{ij} \geq 0$ 且 $\sum_{j=1}^N T_{ij} = 1$ 。
初始状态分布（Initial State Distribution）：
- 定义系统开始时的状态概率分布：
  $\pi = \{ \pi_1, \pi_2, \dots, \pi_N \}$
  其中 $\pi_i = P(S_0 = s_i)$ 。

3. 马尔可夫模型的类型

a. 一阶马尔可夫模型

假设：当前状态仅依赖于前一个状态。
转移概率：
$P(S_{t+1} \mid S_t, S_{t-1}, \dots) = P(S_{t+1} \mid S_t)$

b. 高阶马尔可夫模型

假设：当前状态依赖于前 $k$ 个状态。
转移概率：
$P(S_{t+1} \mid S_t, S_{t-1}, \dots) = P(S_{t+1} \mid S_t, S_{t-1}, \dots, S_{t-k+1})$
可以通过增加状态空间将高阶模型转化为一阶模型。

通过将 $k$ 个历史状态组合成一个新的复合状态 $\tilde{S}$ ，高阶依赖就可以被重新表示为一阶依赖。例如：

$\tilde{S}_t = (S_{t-1}, S_{t-2}, \dots, S_{t-k+1})$
转移概率重新定义为：
$P(S_t \mid S_{t-1}, S_{t-2}, \dots, S_{t-k}) = P(\tilde{S}_t \mid \tilde{S}_{t-1})$
这样，原来的高阶依赖关系就被等价地转化为复合状态之间的一阶依赖关系。

c. 隐马尔可夫模型（Hidden Markov Model, HMM）

状态不可观测（隐状态），只能通过观察变量的概率分布推断状态。
是马尔可夫模型的扩展，用于更复杂的场景。

简单类比
想象你在一个被雾气笼罩的森林里迷路了：

隐状态是森林中的实际位置，你看不到它（因为雾太浓）。
观测变量是你听到的声音，比如河流的流水声或鸟叫声。
根据这些声音（观测变量）和你对森林地图的理解（隐马尔可夫模型中的概率分布），你可以推断自己可能在什么地方（隐状态）。

4. 性质与推导

平稳性（Stationarity）

如果系统运行足够长时间，状态分布趋于一个稳定分布 $\pi^\infty$ ，称为平稳分布。
平稳分布满足：
$\pi^\infty T = \pi^\infty$

这个方程的意思是：

当马尔可夫链达到平稳分布 $\pi^\infty$ 后，再进行一次转移（即乘以状态转移矩阵 $T$ ），得到的结果仍然是平稳分布 $\pi^\infty$ 。
换句话说，平稳分布是一个不变向量，它在经过一次状态转移后不会改变。

短期与长期预测

短期预测：利用状态转移矩阵预测未来状态分布。
$P(S_{t+k}) = P(S_t) T^k$

如果你知道在时间 $t$ 时系统处于某个状态 $S_t$ ，并且你有转移矩阵 $T$ ，那么这个公式告诉你在经过 $k$ 步之后（即时间 $t + k$ ），系统处于某个状态的概率。
状态转移矩阵 $T$ 给出了从一个状态到另一个状态的转移概率，而矩阵的幂 $T^k$ 给出了在 $k$ 步的时间跨度内，各个状态之间的转移概率。
本公式解析及示例