统计学习方法笔记（十五）条件随机场（二）

最新推荐文章于 2022-11-17 16:29:48 发布

yeyustudy

最新推荐文章于 2022-11-17 16:29:48 发布

阅读量806

点赞数

分类专栏：统计学习方法笔记

本文链接：https://blog.csdn.net/yeyustudy/article/details/80526379

版权

统计学习方法笔记专栏收录该内容

23 篇文章 0 订阅

订阅专栏

条件随机场的概率计算问题

问题描述：给定条件随机场 $P(Y|X)$ ，输入序列x和输出序列y，计算条件概率 $P({Y_i} = {y_i}|x),P({Y_{i - 1}} = {y_{i - 1}},{Y_i} = {y_i}|x)$ 以及相应的数学期望的问题。
一、前向-后向算法
对每个指标 $i = 0,1, \cdots ,n + 1$ ，定义前向向量 $\alpha_i(x)$ ：
对于 ${\alpha _0}(y|x)$ ，其在y开始时为1，其余为0，
递推公式有：
$\alpha _i^T(x) = \alpha _{i - 1}^T(x){M_i}(x)$
同理，定义类似的后向向量 $\beta_i(x)$ ，则也有：
${\beta _i}(x) = {M_{i + 1}}(x){\beta _{i + 1}}(x)$
由前向后向向量可得：
$Z(x) = \alpha _n^T(x){\bf{1}} = {{\bf{1}}^T}{\beta _1}(x)$
这里的1均为m维列向量。
二、概率计算
这里写图片描述
三、期望值的计算

条件随机场的学习算法

问题描述：给定训练数据集，估计条件随机场参数。
条件随机场模型实际是定义在时序数据上的对数线性模型，其学习方法包括极大似然估计和正则化的极大似然估计，优化实现算法有改进的迭代尺度法、梯度下降法以及拟牛顿法。
一、改进的迭代尺度法
已知训练数据集，由此可知经验概率分布 $\widetilde P(X,Y)$ ，可以通过极大化训练数据的对数似然函数来求模型参数。
训练数据的对数似然函数为：
$L(w) = {L_{\widetilde P}}({P_w}) = \log \prod\limits_{x,y} {{P_w}{{(y|x)}^{\widetilde P(x,y)}}} = \prod\limits_{x,y} {\widetilde P(x,y)\log {P_w}(y|x)}$
当 $P_w$ 是一个条件随机场模型时，对数似然函数变为：
$L(w) = \sum\limits_{j = 1}^N {\sum\limits_{k = 1}^K {{w_k}{f_k}({y_j},{x_j})} - \sum\limits_{j = 1}^N {\log {Z_w}({x_j})} }$
改进的迭代尺度法是通过迭代的方法不断的优化对数似然函数改变量的下界，达到极大化对数似然函数的目的。具体推导过程见《统计学习方法》第202页。
二、拟牛顿法
见《统计学习方法》第205页