通用知识图谱大体可以分为百科知识图谱(Encyclopedia Knowledge Graph)和常识知识图谱(Common Sense Knowledge Graph)。
百科知识图谱是百科事实构成的,通常是“非黑即白”的确定性知识。早在2010年微软就开始构建商用知识图谱,应用于旗下的搜索、广告、Cortana等项目。2012年谷歌基于Freebase正式发布Google Knowledge Graph。
目前微软和谷歌拥有全世界最大的通用知识图谱,脸书拥有全世界最大的社交知识图谱。而阿里巴巴和亚马逊则分别构建了商品知识图谱。
相比之下,国内知识图谱创业公司则从智能客服、金融、法律、公安、航空、医疗等“知识密集型”领域作为图谱构建切入点。除了上述商业通用图谱以外,DBpedia、Yago、Wikidata、BabelNet等开放域百科知识图谱也蓬勃发展。
另一种常识知识图谱,则集成了语言知识和概念常识,通常关心的是带有一定的概率的不确定事实,因此需要挖掘常识图谱的语言关联或发生概率。下面,我们将对两类知识图谱做详细介绍。
01 百科知识图谱
百科知识图谱构建模式可以分为两类。一类是对单百科数据源进行深度抽取,典型代表有DBpedia。另一类是结合了语言知识库(如WordNet)后,出现了一大批兼具语言知识的百科知识库,如Google Knowledge Graph后端的Freebase、IBM Waston后端的YAGO&