知识图谱1(实体抽取)

对于知识图谱而言,首要的问题是:如何从海量的数据提取有用信息并将得到的信息有效表示并储存,就是所谓的知识抽取与表示技术

知识抽取与表示技术(信息抽取),其目标主要是从样本源中抽取特定种类的信息,例如,实体、关系和属性,并将这些信息通过一定形式表达并储存。它分为:实体抽取、关系抽取和属性抽取。

本文重点介绍实体抽取。实体抽取也称为命名实体识别。实体是知识图谱最基本的元素,实体抽取的完整性、准确率、召回率将直接影响知识图谱的质量。


复习一下准确率和召回率。

 

混淆矩阵中T、F、P、N的含义:

T:真  F:假  P:阳性  N:阴性

则TP: 真阳性  TN:真阴性  FP:假阳性  FN:假阴性

正确率(你认为对的中,有多少确实是对的,所占的比率)

precision = \frac{TP}{TP+FP}

召回率(本来是对的,你找回了多少对的,所占的比率):

Recall = \frac{TP}{TP+FN} 


实体抽取的方法归纳为3种:

(1)基于规则与词典的方法:通常需要为目标实体编写相应的规则,然后在原始语料中进行匹配。

(2)基于统计机器学习的方法:主要利用数据来对模型进行训练,然后再利用训练好的模型去识别实体。

(3)面向开放域的抽取方法:主要是针对海量网络数据。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值