一、知识图谱与语义技术概论
1)人:MEMEX(记忆机器)偏重关联记忆
2)web:以链接为中心的系统
3)语义网:从连接文本到链接链接数据
4)谷歌知识图谱:Things not strings
1⃣️知识图谱发展
2⃣️知识图谱使用
(1)辅助搜索:web理想是万物的链接,搜索的理想是事物的搜索
(2)辅助问答:机器人及IoT设备的智能化就是给他们都挂上一个常识库
(3)辅助决策
(4)辅助AI:常识推理
3⃣️知识图谱的本质
(1)web视角:像建立文本之间的超链接那样建立数据之间的语义链接,并支持语义搜索
(2)NLP视角:怎样从文本中抽取语义和结构化数据
(3)KR视角:怎么利用计算机符号来考试和处理知识
(4)AI视角:怎样利用知识库来辅助理解人的语言
(5)DB视角:用图的方式去存储知识
二、典型知识库项目简介
CYC:http://www.cyc.com/
Wordnet:http://wordnet.princeton.com/
ConceptNet:http://www.conceptnet.io/
Freebase:http://www.freebase.com/
Wikidata:http://www.wikidata.org/
DBPedia:http://dbpedia.org
YAGO:http://mpii.de/yago
BabelNet:http://babelnet.org/
NELL(Never-Ending Language Learner):http://rtw.ml.cmu.edu/
微软Concept Graph:http://concept.research.microsoft.com
OpenKG中文知识图谱资源库:http://OpenKG.cn
Zhishi.me: http://zhishi.me
cnSchema:http://cnschema.org
三、知识图谱相关技术简介
1)知识图谱技术体系:
知识表示、知识抽取、知识搜索、知识问答、知识推理、知识融合、知识众包、知识链接、可视化
2)知识表示:
研究怎样用计算机符号来表示人脑中的知识以及怎样通过符号之间的运算来模拟人脑的推理过程 如:RDF、RDF Graph、RDFS
(1)RDF的序列化格式
OWL 、OWL extends RDF schema、SPARQL、JSON-LD
(2)知识图谱的分布式表示
3)知识抽取:NLP+KR
知识抽取的主要方法
4)知识存储
知识存储比数据存储复杂,知识存储要综合考虑图的特点、复杂的知识结构存储、索引和查询(支持推理)等优化。知识存储一般分为基于关系数据库和基于原生图的存储,实际应用中一般是两者结合使用。
5)知识问答
KBQA 基于知识库的问题回答
6)知识推理
基于已知的事实推出未知的事实的计算过程
7)知识融合
在不同的数据中找出同一个实体的描述记录,主要目的是对不同数据源中的实体信息进行整合,使其更加全面。
常用工具是Dedupe和LIMES
8)知识众包
wikibase、Schema.ORG
四、典型应用案例
Open PHACTS、中医药知识平台、电商知识图谱、企业知识图谱应用(SAP)