本文首发于我的博客:gongyanli.com
今天听了肖仰华教授的《知识图谱与认知智能》总结,反正是听君一席话,胜读十年书,特别是去的时候正好碰上肖老师,和知识男神握了个手,然后接下来几天都吃嘛嘛香。
讲座内容主要围绕知识图谱与认知智能的四大部分:认识、实践、问题和总结
最后问了肖老师几个问题,我记忆深刻的也就是我所关心的问题咯,其余听过就忘哈哈
1.构建知识图谱时是否要用到图数据库?
是否要上图数据库,要具体问题具体分析。如果只是在领域内建立知识图谱,并且实体不多的时候,
用不着上图数据库。因为图数据库不仅成本高,还很复杂。像分布式图数据库,一般有上百亿个实体,
这就有上千亿的边,一般只有google这样子的大公司才会做。肖老师知识工厂的数据库用的是mongodb,
有2000万实体,像这种情况是用不着图数据库的,而且目前做图数据库的人才很匮乏。
2.从文本中抽取实体关系有没有什么好的方法?
我们现在有这么多的结构化以及半结构化的数据可以利用,没到非不得已的情况,没必要大量从文本中
抽取数据。而抽取实体关系的建议是,用知识、深度学习模型或者pattern来做关系抽取,不建议用深度
学习模型来抽取,因为抽取到的结果是不可解释的,建议是用pattern来抽取,因为抽取到的结果可解释,
其中肖老师多次提到用关系来做知识抽取,而且未来的后深度学习时代也是靠知识来学习,而不是靠数据,
这部分我还需要加深理解。毕竟在我的概念里,还不知道如何用知识来做关系抽取?
有人做通用东西,有人做领域的东西,可能最后的结果就是大家一拍即合,联手,然后推动我们整个人工智能的发展。
附上PPT,需要的朋友可以去下载看一下。