CRF条件随机场的原理、例子、公式推导和应用

转子:https://zhuanlan.zhihu.com/p/148813079
在这里插入图片描述
条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,广泛应用于中文分词、命名实体识别、词性标注等标注场景。

条件随机场CRF与深度学习结合,产生了BiLSTM-CRF、BiLSTM-CNN-CRF等模型,在中文分词、命名实体识别、词性标注也取得不错的效果。

条件随机场CRF与Attention机制结合,又发展成了Transformer-CRF、BERT-BiLSTM-CRF等模型,使中文分词、命名实体识别、词性标注效果又有显著提高。

本文先引出条件随机场CRF的场、随机场、团、最大团等相关基础概念;接着介绍CRF的原理,重点阐述了线性链条件随机场的原理;然后介绍CRF在中文分词、命名实体识别、词性标注的具体应用;最后对CRF进行总结,指出图模型之间的演化关系,及CRF模型的发展简史。

本文结构如下:

一、CRF基础
1、无向图
2、马尔可夫随机场
3、最大团
4、无向图的因子分解

二、CRF原理
1、条件随机场
2、线性链条件随机场
3、线性链条件随机场公式
4、条件随机场例子

三、CRF应用
1、中文分词
2、命名实体识别
3、词性标注

四、CRF总结
1、CRF的概括总结
2、图模型之间的关系
3、CRF的发展简史

在这里插入图片描述

一、CRF基础

在这里插入图片描述
1、无向图

什么是图?什么是无向图?

在这里插入图片描述
2、马尔可夫随机场

什么是场?什么是随机过程?

在这里插入图片描述
什么是随机场?什么是马尔可夫随机场?
在这里插入图片描述
3、最大团

什么是团?什么是最大团?

在这里插入图片描述
4、无向图的因子分解

Hammersley-Clifford 定理如下:
在这里插入图片描述
举个无向图的因子分解的例子。
在这里插入图片描述

二、CRF原理

在这里插入图片描述
1、条件随机场

2001年,John Lafferty, Andrew McCallum 和 Fernando Pereira,在论文《 Conditional Random fields :Probabilistic Models for Segmenting and Labeling Sequence Data》提出条件随机场。

Conditional Random fields :Probabilistic Models for Segmenting and Labeling Sequence Data
​citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.26.803&rep=rep1&type=pdf
提出条件随机场。

在这里插入图片描述
条件随机场定义如下:

在这里插入图片描述
2、线性链条件随机场

在这里插入图片描述
线性链条件随机场的定义如下:

在这里插入图片描述
线性链条件随机场CRF的图结构

在这里插入图片描述
3、线性链条件随机场公式
在这里插入图片描述
特征函数定义如下:

在这里插入图片描述
为了简单起见,将转移特征和状态特征及其权值用统一符号表示。条件随机场简化公式如下:

在这里插入图片描述
4、条件随机场例子

例2:已知中文文本"刘启林”,采用IOB标注方法,求实体标注序列为{ B,I,I }的概率。

在这里插入图片描述
例1的几何描述如下:

在这里插入图片描述

例1的标注序列为{B、I、I}的联合概率分布如下:

在这里插入图片描述

三、CRF应用

在这里插入图片描述
1、中文分词

刘启林:中文分词的原理、方法与工具
178 赞同 · 8 评论文章

基于CRF由字构词方法的基本思想,基本原理如下:

在这里插入图片描述

CRF中文分词的图结构如下:

在这里插入图片描述
2、命名实体识别

刘启林:中文命名实体识别NER的原理、方法与工具
195 赞同 · 16 评论文章

基于CRF的命名实体识别过程如下:

在这里插入图片描述
CRF命名实体识别的图结构如下:

在这里插入图片描述
3、词性标注

基于CRF词性标注方法的基本思想,基本原理如下:

在这里插入图片描述
CRF中文词性标注的图结构如下:
在这里插入图片描述

四、CRF总结

在这里插入图片描述

1、CRF的概括总结
在这里插入图片描述
2、图模型之间的关系

朴素贝叶斯、HMM、逻辑回归、CRF等图模型关系如下:
在这里插入图片描述

朴素贝叶斯、HMM、逻辑回归、CRF对比如下表所示:
在这里插入图片描述
更多HMM可参考:

刘启林:HMM隐马尔可夫模型的例子、原理、计算和应用
437 赞同 · 39 评论文章

更多LR逻辑回归模型可参考:

刘启林:LR逻辑回归模型的原理、公式推导、Python实现和应用
141 赞同 · 12 评论文章

3、CRF的发展简史

在这里插入图片描述
机器学习阶段:CRF

深度学习阶段:BiLSTM-CRF、BiLSTM-CNN-CRF

Attention阶段:Transformer-CRF、BERT-BiLSTM-CRF

条件随机场CRF一直是标注问题的基础模型。

由于能力和水平的限制,我的可能是错的。

参考文献:
1、王元等, 数学大词典(第二版), 科学出版社[M], 2017.09

2、John Lafferty, Andrew McCallum, and Fernando Pereira, "Conditional Random Fields:

Probabilistic Models for Segmenting and Labeling Sequence Data", June 2001.

3、李航, 统计学习方法(第2版), 清华大学出版社[M], 2019.05

4、宗成庆, 统计自然语言处理(第2版), 清华大学出版社[M], 2013.08

5、Charles Sutton and Andrew McCallum, An Introduction to Conditional Random Fields, 2011

  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WitsMakeMen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值