每日一问6.23

math_computer

于 2020-06-23 23:31:44 发布

阅读量231

点赞数

分类专栏：随想

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/math_computer/article/details/106927138

版权

随想专栏收录该内容

12 篇文章

订阅专栏

问题：条件随机场是怎么进行学习的？

参考了知乎文章如何轻松愉快地理解条件随机场（CRF）？

目录

模型构建
特征函数的例子
- 状态特征函数：
- 转移特征函数：
学习算法

模型构建

条件概率：

$P(y=y'|x)=\frac{e^{\mathbb{w}\cdot F(y', x)}}{\sum_{y}e^{\mathbb{w}\cdot F(y, x)}}$

其中， $\mathbb{w}=(w_1,\cdots, w_K)$ 为待学习的参数组， $F=(f_1(y,x), \cdots, f_K(y,x))$ 为特征函数构成的向量，特征函数包含状态特征函数和转移特征函数两类，每类有若干个。

特征函数的例子

$x=(x_1, \cdots, x_n),y=(y_1, \cdots,y_n)$

状态特征函数：

$f(y_i,x,i)=1$ 如果 $x_i$ 以"ly"结尾， $y_i=副词$ （其他情况为0），此时我们应该想到对应要学习的参数 $\lambda$ 应该大于0，并且值越大表明训练集中的数据越支持"ly"结尾的单词是副词
$f(y_i,x,i)=1$ 如果 $x$ 最后一个字符是"?"， $i=1, y_i=动词$ （其他情况为0），此时我们应该想到对应要学习的参数 $\lambda$ 应该大于0，并且值越大表明训练集中的数据越支持问句的第一个单词是动词

转移特征函数：

$g(y_{i-1},y_{i},x,i)=1$ 如果 $y_{i-1}=名词,y_{i}=动词$ （其他情况为0），此时我们可以想到对应要学习的参数 $\mu$ 应该大于0，并且值越大表明训练集中的数据越支持名词后面接动词
$g(y_{i-1},y_{i},x, i)=1$ 如果如果 $y_{i-1}=动词,y_{i}=动词$ （其他情况为0），此时我们可以想到对应要学习的参数 $\mu$ 应该小于0，并且值越小表明训练集中的数据越反对动词后面接动词

学习算法

优化目标为：极小化负对数似然
$-\frac{1}{N}\sum_{i=1}^{N}logP(y=y^{(i)}|x=x^{(i)})$

对参数的学习，可以使用梯度下降算法，也可以使用二阶的拟牛顿算法L-BFGS，较常用的是后者。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。