用于序列标注的CRF模型

文章:Log-linear models and conditional random fields

一、对数线性模型

模型对x下y的条件概率建模。


Fj(x,y)为特征函数,是x与y的对应性度量,每种特征都表征一种不同类型的对应性。相关的参数,是权重,表示该特征函数的影响。wj=0表示Fj与y的预测无关。人定义特征函数,算法学习权重表示。

Z(x,w)为标准化因子(需要计算标准分数时候用到)


模型预测标签:(x下最大概率标签)


条件概率模型可简化为下面的形式:


这种形式也称为softmax函数

二、特征函数

1. 是什么

特征函数表示一种映射关系,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Transformer-CRF模型是一种结合了Transformer和条件随机场(CRF)的模型。它在自然语言处理(NLP)任务中被广泛应用,特别是在序列标注任务中。 在Transformer-CRF模型中,Transformer用于学习输入序列的表示,它通过自注意力机制来捕捉序列中的上下文信息。Transformer将输入序列映射为一系列的密集向量表示,这些向量表示被传递给CRF模块。 CRF模块是一个序列标注模型,它利用转移矩阵来建模标签之间的转移概率。CRF模块接收Transformer输出的向量表示作为输入,并通过前馈神经网络对输入进行处理。然后,CRF模块使用动态规划算法来计算最优的标签序列,以最大化整个序列的概率。 通过结合Transformer和CRF,Transformer-CRF模型能够同时捕捉输入序列的上下文信息和标签之间的依赖关系,从而提高序列标注任务的性能。 范例:<<引用:下面是DIET的架构图,可以看到在Transformer之上使用了CRF。Transformer输出的dense vector会传给CRF内部的一个前馈神经网络,另外,在CRF内部存在一个transition matrix(转移状态矩阵)。在这个架构里CRF的作用是完成信息的提取。 。 引用:NLP on Transformers 高手之路137课Pro版:https://appz0c1mshy7438.h5.xiaoeknow.com/v1/goods/goods_detail/p_621c0289e4b04d7e2fd0365a?type=3&share_type=5&share_user_id=u_621b7b85b8dc5_3yDAYnFXeM&entry=2&entry_type=2001。>> Transformer-CRF模型是一种结合了Transformer和条件随机场(CRF)的模型。它在自然语言处理(NLP)任务中被广泛应用,特别是在序列标注任务中。在这个模型中,Transformer用于学习输入序列的表示,而CRF用于建模标签之间的转移概率。通过结合Transformer的上下文信息和CRF的标签依赖关系,Transformer-CRF模型能够提高序列标注任务的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值