ASR 隐马尔可夫模型（HMM）

最新推荐文章于 2024-09-16 08:44:25 发布

Charles Tu

最新推荐文章于 2024-09-16 08:44:25 发布

阅读量1k

点赞数

分类专栏： ASR 文章标签： hmm 语音识别隐马尔可夫模型

本文链接：https://blog.csdn.net/Tq_bu2/article/details/104223772

版权

本文介绍了隐马尔可夫模型（HMM）在语音识别中的应用，阐述了HMM的基本概念，包括状态转移概率和观测概率，并探讨了HMM在概率计算、预测和学习三大问题上的作用。通过一个盒子和球的例子帮助理解HMM的工作流程，同时指出常规求解方法的高复杂度，引出前向和后向算法的重要性。

摘要由CSDN通过智能技术生成

前言

马尔可夫模型（HMM）是表达常用的数学模型，相关概念在随机过程中能学到。在语音识别（ASR）中，是基础且重要的模型之一。本篇文章主要介绍：

HMM 概念
前向和后向算法
维特比算法

隐马尔可夫模型（HMM）

简单理解HMM

数据科学中，预测是一个经久不衰的问题。以常见的时间为序数据为例，数据科学家期望对过去（ $t_{0}$ 时刻）和当前（ $t_{N}$ 时刻）数据的观察( Time )，实现预测未来（ $t_{N+1}$ 时刻）的值，HMM也是为了干这类事情而生的统计模型。

做个不恰当但有意思的比喻，假设数据科学家是算命先生，观察到的数据是求富贵顾客的生辰八字、面相等等。中式算命先生掏出周易算本（统计模型），输入观察数据，得出结果——顾客会富贵。这么个过程就是数据科学常干的事，HMM也是为了干类似的事情而生的统计模型（想象成周易算本）。
分享其它博主拿HMM干的事：
1、预测女朋友心情

现在回到HMM，实际HMM或者其它统计学方法能干的不止这些，包括分类、数据压缩等都是常见任务。通过概率的表达，HMM大多用于时间序列的模型，预测天气、股票等。HMM的主要机理由内部状态节点实现，包含各节点之间的转移概况，以及各状态与实际观测结果之间的观测概率。或者，换个方式理解转移概率和观测概率，转移概率代表数据变化主要趋势，观测概率包含可能的观测与主趋势差异。通过不断输入观测数据的训练，最终转移概率能把握数据随时间的主要变化规律，从而实现下一时刻的预测。因为模型内部的状态是不可观测，所以是“隐”（Hidden）。

HMM三大基本问题：

概率计算问题：已知模型参数和观测值，计算观测值的概率；
预测问题：已知模型和观测值，计算观测值概率最大时，随时间变化的状态路径；
学习问题：已经观测值，估计使观测值概率最大的模型。

图解HMM流程

先介绍盒子和球的例子：假设有三个盒子，盒子里都有红球和白球，每次观测选取一个盒子取一个球。根据以上介绍，HMM模型参数在例子中表示如下表

模型参数	参数值	概率表达	意义
状态集合	【1号盒子，2号盒子，3号盒子】		HMM的状态节点
状态转移概率	$\begin{bmatrix} a_{12} & a_{22} & a_{32} \\ a_{12} & a_{22} & a_{32} \\ a_{13} & a_{23} & a_{33} \end{bmatrix}$