CRF以及BiLSTM+CRF

本文介绍了BiLSTM+CRF模型的原理和应用,重点讲解了CRF层如何通过学习转移得分来考虑标签之间的关系。同时,对比了生成式模型与判别式模型,探讨了概率无向图模型与贝叶斯网络的关系,并阐述了线性链CRF的条件概率及其特征函数。文章最后强调理解CRF参数化形式和解决概率估计、参数学习及预测问题的重要性。
摘要由CSDN通过智能技术生成

BiLSTM+CRF

现在比较流行的是bilstm+crf,即在bilstm后面接了crf层

  • 经过bilstm得到隐状态序列 ( h 1 , h 2 , . . . , h n ) ∈ R n ∗ m (h_1,h_2,...,h_n) \in R^{n*m} (h1,h2,...,hn)Rnm
  • 接入一个线性层,转换隐状态序列的维度,从 m m m维转换到 k k k维, k k k是标签数。我们可以理解这一步是由网络自动学习当前时刻对应到每个标签的分数。
  • 接下来是CRF层,这一层需要学得的参数是 ( k + 2 ) ∗ ( k + 2 ) (k+2)*(k+2) (k+2)(k+
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值