【项目调研+论文阅读】(目录)中文实体识别研究方法综述 day6


《中文命名实体识别研究方法综述》李嘉欣 陆军工程大学

一、基于词典和规则的方法

 构建大量的规则集或字典,然后按照需求将需要识别的汉字串放入制定的规则集中或与所构建的字典进行匹配,经过多次修正直到匹配成功。但这种方法只能在小数据集上得到很好的准确率,而随着数据集中数据的增加这种方式变得不再适用。
 缺点:只能在特定的语料上识别能够得到很高的准确度,这样随着需要识别的实体多样化就需要制定更多的规则和更大的词典。

二、基于统计机器学习的方法
1.隐马尔可夫模型(HiddenMarkovMode,HMM)的方法
2.基于最大熵(MaxmiumEntropy)的 方 法
3.基 于 支 持 向 量 机(SupportVectorMachine,SVM)的方法
4.基于条件随机场(ConditionalRandomFields,CRF)的方法
5.基于统计中的自增长统计算法的方法
三、基于统计与规则结合的方法
四、基于深度学习的方法

[14]2015:YonghuiW, MinJiang, JianboLei, HuaXu. Named Entity
Recognitionin Chinese Clinical Text Using Deep Neural Network. Studiesin Health Technology and Informatics,2015:624-628

[15]BILSTM-CRF:Zhiheng Huang,Wei Xu and Kai Yu.Bidirectional LSTM-CRF Models for Sequence Tagging[J]. arXiv,2015.1508.01991

[16]2016-BILSTM-CNNs-CRF:MAX, HOVYE. End-to-end Sequence Labeling ViaBi-directional LSTM-CNNs-CRF[J]. arXivpreprintarXiv:1603.01354,2016

五、近期方法

在循环神经网络模型中引入门控 GRU模型。使用CNN、SVM、Lattice、BERT 等模型进行语言预训练,并引入注意力机制、迁移学习等提高命名实体识别的准确度。

[17]SVM-BILSTM-CRF:周晓磊,赵薛蛟,刘堂亮,宗子潇,王其乐,里剑桥 . 基于SVM-BILSTM-CRF模型的财产纠纷命名实体识别方法[J].计算机系统应用,2019.28(1):245-250

[18]LatticeLSTM:王博冉,林夏,朱晓东,朱万琳,马学华 .LatticeLSTM 神经网
络法中文医学文本命名实体识别模型研究[J].中国卫生信息管理杂志,2019.16

[19]BERT 和 BILSTM-CRF:王子牛,姜猛,高建瓴,陈娅先 . 基于 BERT 的中文命名实体识别方法[J].计算机科学,2019.46(S2):138-142

14-19文章分析之后会单独整理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

炖鹅小铁锅

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值