Raki的统计学习方法笔记0xB(11)章：条件随机场

最新推荐文章于 2024-08-31 17:37:59 发布

爱睡觉的Raki

最新推荐文章于 2024-08-31 17:37:59 发布

阅读量488

点赞数

分类专栏：统计学习方法 NLP 文章标签：自然语言处理深度学习机器学习人工智能统计学习方法

本文链接：https://blog.csdn.net/Raki_J/article/details/122277730

版权

NLP 同时被 2 个专栏收录

82 篇文章 10 订阅

订阅专栏

统计学习方法

8 篇文章 0 订阅

订阅专栏

为了完成nlp-beginner任务4，所以先复习一下CRF

按顺序看以下：

模型

条件随机场是由转移特征函数和状态特征函数构成的

参数化形式：
$\begin{aligned} P(y|x)=&\frac{1}{Z(x)}\mathop{\exp}\left(\sum_{i,k}\lambda_k t_k(y_{y-1},y_i,x,i)+\sum_{i,l}\mu_ls_l(y_i,x,i) \right) \\ Z(x) =& \sum_y \mathop{\exp}\left(\sum_{i,k}\lambda_k t_k(y_{y-1},y_i,x,i)+\sum_{i,l}\mu_ls_l(y_i,x,i) \right) & \end{aligned}$

简化形式：
$\begin{aligned} & f_k(y_{i-1},y_i,x,i)=\begin{cases} t_k(y_{y-1},y_i,x,i), &k =1,2,...,K_1\\ s_l(y_i,x,i),&k=K_1+l;l=1,2,...,K_2 \end{cases} \\ & f_k(y,x)=\sum_{i=1}^nf_k(y_{i-1},y_i,x,i),k=1,2,...,K \\ & w_k=\begin{cases} \lambda_k,k=1,2,...,K_1\\ \mu_l,k=K_1+l;l=1,2,...,K_2 \end{cases} \\ & P(y|x)=\frac{1}{Z(x)}\mathop{\exp}\sum_{k=1}^Kw_kf_k(y,x) \\ & 若w和F(一个K个特征函数组成的向量)为向量形式：\\ & P_w(y|x)=\frac{\mathop{\exp}(w \cdot F(y,x))}{Z_w(x)} \end{aligned}$

学习策略

$\begin{aligned} y^* &= \mathop{\arg\max_{y}}P(y|x) \\ &=\mathop{\arg\max_{y}}\frac{\mathop{\exp}(w \cdot F(y,x))}{Z_w(x)}\\ &=\mathop{\arg\max_{y}\mathop{\exp}(w \cdot F(y,x))}\\ &=\mathop{\arg\max_{y}}(w \cdot F(y,x))\\ \end{aligned}$
条件随机场的预测问题成为求非规范化概率最大的最优路径问题：
$\begin{aligned} \mathop{\max_{y}}(w \cdot F(y,x)) \end{aligned}$
为了求解最优路径，讲上式写成如下形式：
$\begin{aligned} \mathop{\max_{y}}\sum_{i=1}^nw \cdot F_i(y_{i-1},y_i,x) \end{aligned}$

预测算法

输入：模型特征向量 $F (y, x)$ 和权值向量 $w$ ,观测序列 $x = (x_1,x_2,...,x_n)$
输出：最优路径 $y^*=(y_1^*,y_2^*,...,y_n^*)$
（1）初试化：
$\begin{aligned} \delta_1(j)=w \cdot F_1(y_0=start,y_1=j,x),j=1,2,...,m \end{aligned}$
（2）递推：对 $i = 2, 3, . . ., n$
$\begin{aligned} & \delta_1(j)= \mathop{\max_{i\le j \le m }} \{\delta_{i-1}+w \cdot F_i(y_{i-1}=j,y_i=l,x) \},j=1,2,...,m \\ & \Psi_i(l)=\mathop{\arg\max_{1 \le j \le m}}\{\delta_{i-1}+w \cdot F_i(y_{i-1}=j,y_i=l,x) \},j=1,2,...,m \end{aligned}$
（3）终止：
$\begin{aligned} \mathop{\max_{y}}(w &\cdot F(y,x)) = \mathop{\max_{i\le j \le m }}\delta_n(j) \\ & y_n^* = \mathop{\arg\max_{i\le j \le m }}\delta_n(j) & \end{aligned}$
（4）返回路径：
$\begin{aligned} y_i^* = \Psi_{i+1}(y_{i+1}^*), i=n-1,n-2,...,1 \end{aligned}$
求得最优路径： $y^*=(y_1^*,y_2^*,...,y_n^*)$