《大数据智能-big data intelligence》第二章:知识图谱

1. 什么是知识图谱

2. 知识图谱的构建

  • KG(knowledge graph)最重要的数据来源之一是维基百科、百度百科等大规模知识库,其包含大量的结构化的知识,可以高效转化到KG中;还有互联网的海量网页也蕴含了海量知识,通过自动化技术,将其抽取出来构建知识图谱。

2.1 大规模知识库

  • freebase、DBpedia、YAGO等

2.2互联网链接数据

  • W3C的开放互联数据项目(Linked Open Data,LOD),目的是把由互联文档组成的万维网(Web of documents)扩展成由互联数据组成的知识空间(Web of data)。
  • LOD以RDF(Resource Description FrameWork)形式在Web上发布各种开放数据集。
  • RDF将实体间的关系表示为(实体1,关系1,实体2)的三元组。

2.3互联网网页文本数据

  • 致力于直接从无结构的互联网网页中抽取结构化信息;项目有OpenIE(open information extraction)、NELL(never-ending language learning).
  • 缺点:网页形式多样,数据的噪声较多,信息可信度较低。

2.4多数据源的知识融合

-主要包括实体融合、关系融合、和实例融合三类。

3.KG的典型应用

  • 查询理解(Query Understanding)
  • 自动问答(Question Answering)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值