知识图谱(二)知识抽取

一、知识抽取任务(实体抽取、关系抽取、事件抽取构建数据库)

从不同来源、结构的数据中进行知识抽取,形成知识存入到知识图谱

  • 结构化数据:链接数据、数据库
  • 半结构化数据:表格列表
  • 纯文本数据(NLP领域--信息抽取)

最终形成RDF三元组、多元组事件、时序信息

子任务:

  • 命名实体识别:检测及分类
  • 术语抽取---文献资料、MOOC进行术语的抽取,形成知识点知识图谱
  • 关系抽取
  • 事件抽取:触发词(确定事件)、时间、地点、攻击者、伤亡人数
  • 共指消解(Co-reference Resolution CR)

  1. 实体抽取:对一个句子进行序列标注,人工特征有:
  • 词本身特征(边界特征、词性、依存关系)
  • 前后缀特征
  • 字本身特征(是否是数字、是否是字符)  
  •    

2.关系抽取

基于触发词:如夫妻、配偶、老婆等-----词法分析

基于句法分析:

3事件抽取

 

二、结构化数据的知识抽取

三、半结构化数据的知识抽取

四、基于百科数据的知识抽取

五、面向文本的知识抽取

  1. DeepDive关系抽取实战
  2. 开放域关系抽取
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值