4-2知识抽取-实体识别与分类（一）

萌新滴程序员

于 2024-07-15 10:37:08 发布

阅读量201

点赞数 4

文章标签：知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w_gun/article/details/140431997

版权

实体识别的主要目标：

从文本中识别实体边界及其类型。

实体识别的常用方法：

基于模版和规则：将文本与规则进行匹配来识别出命名实体。

优点：准确，有些实体识别智能依靠规则抽取。

缺点：需要大量语言学知识；需要谨慎处理规则之间的冲突问题；构建规则的过程费时费力，可移植性不好。

基于序列标注的方法：

确定标签体系->选择模型->定义特征->模型训练

其中，特征有：词本身特征：边界特征、词性、依存关系等；前后缀特征：姓氏、地名；字本身的特征：是否是数字、是否是字符。

常用的序列标注模型：

HMM（隐马尔可夫模型）：

有向图模型

萌新滴程序员

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
4-2知识抽取-实体识别与分类（一）

其中，特征有：词本身特征：边界特征、词性、依存关系等；前后缀特征：姓氏、地名；字本身的特征：是否是数字、是否是字符。缺点：需要大量语言学知识；需要谨慎处理规则之间的冲突问题；构建规则的过程费时费力，可移植性不好。确定标签体系->选择模型->定义特征->模型训练。基于模版和规则：将文本与规则进行匹配来识别出命名实体。优点：准确，有些实体识别智能依靠规则抽取。从文本中识别实体边界及其类型。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。