中文NER-基于网格LSTM的中文命名实体识别Chinese NER Using Lattice LSTM

最新推荐文章于 2023-10-13 10:46:14 发布

StellaLiu萤窗小语

最新推荐文章于 2023-10-13 10:46:14 发布

阅读量766

点赞数

分类专栏： NLP 文章标签： lstm 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/anqi3776/article/details/120328486

版权

本文提出了一种名为Lattice LSTM的网络结构，旨在解决中文命名实体识别中的分词错误问题。Lattice LSTM结合字符和词级别的信息，通过动态引入所有可能的词边界信息，提高了模型对上下文的理解和鲁棒性。与基于字或词的模型相比，Lattice LSTM在不需要分词任务数据的情况下，利用词向量增强实现了更好的表现。

摘要由CSDN通过智能技术生成

基于网格LSTM的中文命名实体识别

细节一:融合字符与词级别特征
- LatticeLSTM
细节二：从LSTM到LatticeLSTM
实验

在这里插入图片描述
本文idea提出原因
中文命名实体识别的实体边界划分特别难。
基于字符级别：无分词错误，缺少词的边界信息，利用不了已有词典
基于词级别：有分词错误，因为只能有一种分词
深度学习一定程度上解决了对词典的依赖
如何利用现有词典，引入所有可能词的边界信息?
研究成果：
＞动态引入所有可能的词信息
＞克服了基于词模型的分词错误问题
＞能自动选择适合当前上下文的可能分词
＞融合字词向量的信息，更好的上下文提取模型
＞句子长度增加，模型相对更加鲁棒
引入词汇增强解决中文NER问题
融合字词信息的动态网络结构
摘要核心

基于字符级别的中文NER无法引入分词结构的先验信息
基于词级别的中文NER会引入分词错误
提出Lattice LSTM网络结构，以字符级别为基础，动态融入词级别的信息

Baseline模型
输入表示:字、词、特征或者互相融合
特征抽取:CNN/LSTM/BiLSTM/Transformer
解码:CRF>Softmax

最低0.47元/天解锁文章

StellaLiu萤窗小语

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。