条件随机场CRF(二)

最新推荐文章于 2023-05-17 14:29:51 发布

谈笑风生...

最新推荐文章于 2023-05-17 14:29:51 发布

阅读量239

点赞数

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/qq_40176087/article/details/104044666

版权

自然语言处理专栏收录该内容

16 篇文章 4 订阅

订阅专栏

CRF主要涉及到三个问题，标记序列概率的计算、参数的学习、序列的预测(解码)，本片博文主要介绍第一个问题：标记序列概率的计算–前向后向算法，在博文中提到，在BI-LSTM-CRF模型框架的CRF层，当计算序列所有路径的总得分时就用到了前向后向算法的思想。

CRF前向后向概率计算

首先定义 $\alpha_i(y_i|x)$ 表示序列位置 $i$ 的标记是 $y_i$ 时,在位置 $i$ 之前的部分标记序列的非规范化概率。之所以是非规范化概率是因为我们不想加入一个不影响结果计算的规范化因子 $Z (x)$ 在分母里面。
在条件随机场CRF(一)中，我们定义了下式：
$M_i(y_{i-1},y_i |x) = exp(\sum\limits_{k=1}^Kw_kf_k(y_{i-1},y_i, x,i))$
这个式子定义了在给定 $y_{i−1}$ 时，从 $y_{i−1}$ 转移到 $y_i$ 的非规范化概率。
这样，我们很容易得到序列位置 $i + 1$ 的标记是 $y_{i+1}$ 时，在位置 $i + 1$ 之前的部分标记序列的非规范化概率 $\alpha_{i+1}(y_{i+1}|x)$ 的递推公式：
$\alpha_{i+1}(y_{i+1}|x) = \alpha_i(y_i|x)M_{i+1}(y_{i+1},y_i|x) \;\; i=1,2,...,n+1$
同样的,我们定义 $\beta_i(y_i|x)$ 表示序列位置 $i$ 的标记是 $y_i$ 时，在位置 $i$ 之后的从 $i + 1$ 到 $n$ 的部分标记序列的非规范化概率。这样，我们很容易得到序列位置 $i + 1$ 的标记是 $y_{i+1}$ 时，在位置 $i$ 之后的部分标记序列的非规范化概率 $\beta_{i}(y_{i}|x)$ 的递推公式：
$\beta_{i}(y_{i}|x) = M_{i+1}(y_i,y_{i+1}|x)\beta_{i+1}(y_{i+1}|x)$
有了前向后向概率的定义和计算方法，我们就很容易计算序列位置 $i$ 的标记是 $y_i$ 时的条件概率 $P(y_i|x)$ :
$P(y_i|x) = \frac{\alpha_i^T(y_i|x)\beta_i(y_i|x)}{Z(x)} = \frac{\alpha_i^T(y_i|x)\beta_i(y_i|x)}{ \alpha_{n}^T(x) \bullet \mathbf{1}}$
也容易计算序列位置 $i$ 的标记是 $y_i$ ，位置 $i - 1$ 的标记是 $y_{i−1}$ 时的条件概率 $P(y_{i-1},y_i|x)$ :
$P(y_{i-1},y_i|x) = \frac{\alpha_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)} = \frac{\alpha_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{ \alpha_{n}^T(x) \bullet \mathbf{1}}$
以上就是精简的CRF的前向后向算法。

谈笑风生...

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
条件随机场CRF(二)

CRF主要涉及到三个问题，标记序列概率的计算、参数的学习、序列的预测(解码)，本片博文主要介绍第一个问题：标记序列概率的计算–前向后向算法，在博文中提到，在BI-LSTM-CRF模型框架的CRF层，当计算序列所有路径的总得分时就用到了前向后向算法的思想。CRF前向后向概率计算首先定义αi(yi∣x)\alpha_i(y_i|x)αi(yi∣x)表示序列位置iii的标记是yiy_iyi时,...
复制链接

扫一扫