知识图谱
目的
以结构化的方式描述客观世界中概念、实体、事件及其间的关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。
概念
人们理解客观世界的线索,是人们对客观世界中的事物在不同层次上的概念化描述,概念层次是知识图谱的“骨骼”
- 如人、动物、组织机构等
实体
客观世界中的具体事物
- 如篮球运动员姚明、互联网公司腾讯等
事件
客观世界的活动
- 如地震、买卖行为等
关系
述概念实体、事件之间客观存在的关联
- 如毕业院校描述了个人与其所在院校的关系,运动员和篮球运动员之间概念和子概念的关系等
现有知识图谱资源
根据信息来源和获取方式的不同划分:
依靠人工构建的知识资源
- 早期知识资源通过人工添加和合作编辑获得
- 例如
- WordNet
- Cyc
- 通用的世界知识库
- 目的
将上百万条知识编码为机器可处理形式,并在此基础上实现知识推理等人工智能相关任务
- HowNet
基于群体智能的知识图谱
- 维基百科是至今利用群体智能建立的互联网上最大的知识资源,因此出现了很多使用维基百科构建知识库的项目
- 例如
- DBpedia
以构建本体的形式对知识条目进行组织 - YAGO
融合 Word Net良好的概念层次结构和维基百科中的大量实体数据 - Freebase
基于维基百科,使用群体智能方法建立的包含6800万实体的结构化数据的知识图谱 - XLORE
以英文维基百科为桥梁,通过跨语言链接技术,建立融合了四大中英文百科数据的跨语言知识库
- DBpedia
基于互联网链接数据构建的知识资源
国际万维网组织 W3C 于2007 年发起的开放互联数据项目(Linked