NLP基础知识4【CRF】

最新推荐文章于 2024-09-01 21:08:00 发布

WHY-233

最新推荐文章于 2024-09-01 21:08:00 发布

阅读量775

点赞数 25

文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/GS2333/article/details/140601649

版权

目录

基本原理
过程
PS

基本原理

X是输入文本（观测序列）
y是输出标签（状态序列）
特点：
每个状态都可以由整个观测序列决定，与 ${x_1,x_2,.....x_n}$ 都相关，实际上一般是上下文10个token就可以了。
对每一个状态y仅与相邻状态 $y_{i-1},y_{i+1}$ 相关
# 公式
通过公式对条件概率进行建模，对于已知概率的观测序列X，求其发生的情况下，各个序列y的发生概率。
$t_j$ 是转移特征函数，主要衡量相邻状态 y之间的影响，同时可以与x相关联
$s_k$ 是状态特征函数，主要衡量观测序列 x对状态变量的影响
$\lambda$ 和 $\mu$ 是对应特征函数的权重
exp用于定义模型中的概率分布函数
Z是规范化因子，用于确保式子是一个概率

在这里插入图片描述

过程

CRF模型完全由特征函数和权重决定：

训练阶段（编码）用优化算法迭代，调个包就行
预测阶段（解码）使用维特比算法（动态规划，类似广度优先搜索），寻找概率最高的标签路径
- 使用暴力搜索不可能，使用贪心算法未必是全局最优

在这里插入图片描述

PS

转移矩阵 (Transition Matrix)：

这是CRF模型中的一个矩阵，用于表示从一个状态（或标签）转移到另一个状态的概率。对于序列标注任务来说，状态可以是不同的标签（如B（开头）、I（中间）、O（其他）），转移矩阵告诉模型在给定前一个标签后，下一个标签出现的可能性有多大。

发射矩阵 (Emission Matrix)：

发射矩阵用于表示观察到某个状态下特定观察值的概率。在序列标注中，观察值通常是输入的词语或特征，而状态则是对应的标签。发射矩阵告诉模型在给定一个标签时，观察到具体词语的概率。

得分矩阵 (Score Matrix)：

得分矩阵是指CRF模型为每个可能的标签序列分配的分数。这些分数基于转移矩阵和发射矩阵的组合计算得出，通常利用动态规划算法（如维特比算法）来确定最佳的标签序列。

关注

25
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
NLP基础知识4【CRF】

x1x2.....xnyi−1yi1tjsk。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。