目录
隐马尔科夫模型 是结构最简单的动态贝叶斯网,主要用于时序建模 如语音识别,自然语言处理扥领域的应用。
隐马尔科夫模型 是结构最简单的动态贝叶斯网,主要用于时序建模 如语音识别,自然语言处理扥领域的应用。
简单介绍:
1.隐马尔可夫模型的变量可分为两组:
第一组:状态变量 亦称隐变量(hidden variable) 通常是隐藏的不可被观测的 (维度N)
第二组:观测变量(维度M)
2变量之间的关系:
在任意时刻观测变量的取值只依赖于状态变量,与其他的状态变量和观测变量的取值无关。
在任意时刻观测变量的取值只依赖于状态变量,与其他的状态变量和观测变量的取值无关。
在任意时刻观测变量的取值只依赖于状态变量,与其他的状态变量和观测变量的取值无关。
重要的事情说三遍!
3.确定隐马尔科夫模型需要以下三种参数:
状态转移概率:模型在各个状态间转移的概率 A (N*N)
输出观测矩阵:模型根据当前状态获得各个观测值得概率 B(N*M)
初始状态概率:模型在初始时刻各个状态出现的概率 Z(1*N)
4.隐马尔可夫模型主要解决三个问题 :
1.给定模型{A,B,Z} ,如何有效的计算产生观测序列 x1 x2,x3,x4...xn 的概率P 换而言之,如何评估模型与观测序列之间的匹配程度?
许多任务根据以往的观测序列 来推测当前时刻最有可能的观测值Xn
观测序列
2.给定模型{A,B,Z} ,如何有效的计算缠身观测序列 x1 x2,x3,x4...xn 。如何查找与观测序列最匹配的的装填序列y1,y2 ,y3,y4,..yn?h换而言之,如何根据观测序列推断隐藏的模型状态?
在语音识别等任务重 观测值为语音信号
隐藏状态为文字
目标就是根据观测信号来推断最有可能的状态序列
3.给定观测序列观测序列x1 x2,x3,x4...xn 如何训练模型{A,B,Z} 是的改序列出现的概率最大?换而言之如何训练模型是其能最好的描述观测数据。
人工设置的参数越来越跟不上人们的需求们如何根据样本学的最优的参数是第三个问题
如何解决这三个问题:
1.求概率问题
直接计算法(N的T次方)
前向 后向算法(N的平方乘T)
2.求序列问题
维特比算法
3.求模型的参数
EM 算法
未完~待续