中文NER-基于网格LSTM的中文命名实体识别Chinese NER Using Lattice LSTM

本文提出了一种名为Lattice LSTM的网络结构,旨在解决中文命名实体识别中的分词错误问题。Lattice LSTM结合字符和词级别的信息,通过动态引入所有可能的词边界信息,提高了模型对上下文的理解和鲁棒性。与基于字或词的模型相比,Lattice LSTM在不需要分词任务数据的情况下,利用词向量增强实现了更好的表现。
摘要由CSDN通过智能技术生成

在这里插入图片描述
本文idea提出原因
中文命名实体识别的实体边界划分特别难。
基于字符级别:无分词错误,缺少词的边界信息,利用不了已有词典
基于词级别:有分词错误,因为只能有一种分词
深度学习一定程度上解决了对词典的依赖
如何利用现有词典,引入所有可能词的边界信息?
研究成果:
>动态引入所有可能的词信息
>克服了基于词模型的分词错误问题
>能自动选择适合当前上下文的可能分词
>融合字词向量的信息,更好的上下文提取模型
>句子长度增加,模型相对更加鲁棒
引入词汇增强解决中文NER问题
融合字词信息的动态网络结构

摘要核心

  1. 基于字符级别的中文NER无法引入分词结构的先验信息
  2. 基于词级别的中文NER会引入分词错误
  3. 提出Lattice LSTM网络结构,以字符级别为基础,动态融入词级别的信息

Baseline模型
输入表示:字、词、特征或者互相融合
特征抽取:CNN/LSTM/BiLSTM/Transformer
解码:CRF>Softmax

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值