细粒度命名实体识别

最新推荐文章于 2022-12-07 08:45:00 发布

jmschentt

最新推荐文章于 2022-12-07 08:45:00 发布

阅读量4.7k

点赞数 1

分类专栏：自然语言处理算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jmschentt/article/details/51853574

版权

简介

对于一个已识别出的命名实体，可能属于多个不同粒度的类别，比如“高加索牧羊犬”可能属于的类别包括“狗”、“犬科动物”、“动物”等。命名实体的上位词（Hypernym）指示了其类别，上述的“狗”、“犬科动物”、“动物”都是“高加索牧羊犬”的上位词。目前被广泛使用人工构建的语义词典中就有这样的上下位关系，比如英文的WordNet、汉语的知网、同义词词林(扩展版)。

但是这些词典资源有限，很多研究者尝试才用自动的方法抽取上位词，以往的上位词抽取研究中，常用的方法主要包括：基于模式匹配的方法、基于统计分布相似度的方法、基于在线百科的方法。

其中，基于模式匹配的方法效果不好，主要源于匹配模式有限或有交叉。基于统计分布相似度的方法都基于一个假设：下位词的上下文词汇是其上位词上下文词汇的一个真子集。例：“熊猫”的上下文一定也是“动物”的上下文，但反过来，“动物”的上下文不一定是“熊猫”的上下文，也包括了其他种类动物的上下文。但这样的假设太强，并不能总成立。基于在线百科的方法是用百科页面中的类别标

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
细粒度命名实体识别

简介对于一个已识别出的命名实体，可能属于多个不同粒度的类别，比如“高加索牧羊犬”可能属于的类别包括“狗”、“犬科动物”、“动物”等。命名实体的上位词（Hypernym）指示了其类别，上述的“狗”、“犬科动物”、“动物”都是“高加索牧羊犬”的上位词。目前被广泛使用人工构建的语义词典中就有这样的上下位关系，比如英文的WordNet、汉语的知网、同义词词林(扩展版)。但是这些词典资源有限，很多研
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。