命名实体识别 序列标注 HMM 条件随机场模型(CRF)

参考资料:https://www.bilibili.com/video/av60970191?from=search&seid=3977397025416398199

条件随机场:是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,特点是输出随机变量构成马尔科夫随机场。

线性链条件随机场,由输入序列对输出序列预测的判别模型,形式为对数线性模型,学习方法为极大似然估计或正则化的极大似然估计。线性链条件随机场应用于标注问题

命名实体识别(named entity recognize)NER

1 在通用领域中,分为人名、地名、组织机构名、日期时间和专用名词

2 在学术中,分为三大类,七小类:

          三大类:实体类、时间类、数字类

          七小类:人名、地名、组织机构名、时间、日期、货币、百分比

3 主要算法:

  • 早期:基于规则、基于字典
  • 传统机器学习方法:HMM、CRF
  • 深度学习方法:RNN-CRF,CNN-CRF
  • 最近的方法:Attention 迁移学习 半监督学习

一、HMM

        通过计算统计量来实现,对于词性标注任务来说,L这一状态集合表示的是词性的集合,W这一观测集合表示的是词典,A这一状态转移矩阵是对于L词性集合中各个词性转移情况的集合,B这一状态下的发射矩阵是L这一状态矩阵对W这一词典中的概率统计,π这一初始状态下的概率分布,即在句子中第一个词一般是什么情况的词性的概率统计。

因此要求得某句话的词性标注序列,用暴力带入即可,即在某个词性下这个词的概率及两个相邻词的概率等

暴力搜索法代价过大,一般使用基于动态规划的Vitebi方法

主要实现代码:

二、CRF模型

概率无向图模型即马尔科夫随机场,是一个由无向图表示的联合概率分布     

三、LSTM模型的序列标注

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值