1. 什么是知识图谱
2. 知识图谱的构建
- KG(knowledge graph)最重要的数据来源之一是维基百科、百度百科等大规模知识库,其包含大量的结构化的知识,可以高效转化到KG中;还有互联网的海量网页也蕴含了海量知识,通过自动化技术,将其抽取出来构建知识图谱。
2.1 大规模知识库
- freebase、DBpedia、YAGO等
2.2互联网链接数据
- W3C的开放互联数据项目(Linked Open Data,LOD),目的是把由互联文档组成的万维网(Web of documents)扩展成由互联数据组成的知识空间(Web of data)。
- LOD以RDF(Resource Description FrameWork)形式在Web上发布各种开放数据集。
- RDF将实体间的关系表示为(实体1,关系1,实体2)的三元组。
2.3互联网网页文本数据
- 致力于直接从无结构的互联网网页中抽取结构化信息;项目有OpenIE(open information extraction)、NELL(never-ending language learning).
- 缺点:网页形式多样,数据的噪声较多,信息可信度较低。
2.4多数据源的知识融合
-主要包括实体融合、关系融合、和实例融合三类。
3.KG的典型应用
- 查询理解(Query Understanding)
- 自动问答(Question Answering)
- 文