今天是王硕老师做的报告,关于知识图谱的报告
knowledge graph(KG)
一、知识图谱的由来
阅读组合的实例,有很多发生的fact,表示成图的结构,顶点和边,边上叫关系(nationality、contained-by),顶点叫时间。
最早谷歌建立的知识图谱,为了搜索信息方便,把所有相关的fact存到知识图谱里面,进而在知识图谱里面查到相关的事情
这个图上最多的那一部分是红色的生命科学
交叉研究,文本-语义分解-得到三元组;联系到自然语言处理,数据库,机器学习,知识工程
语言类 ----大词林、WordNet查同类词,各个领域都有建立知识图谱,有针对事实的,有针对常识的
YAGO多语言知识库(包含中文) - 图谱 - 开放知识图谱 (openkg.cn)
WikiData中文部分-截至2017.01 - 图谱 - 开放知识图谱 (openkg.cn)
可视化,知识推理,知识抽取,知识融合,知识表示,知识问答,知识众包(百度词条,大家一起来做这件事)
主 谓 宾 给实体和关系以编号
关 系、属性上做推理,属性即什么是什么。
Protege手动构建知识图谱,上面是概念下面是实例
知识抽取技术(实体抽取、关系抽取、事件抽取)
那个BIO,是B为开头,O代表结束
端到端的,可以找到文本中实体的关系,涉及到实体的识别
实体识别-实体链接 DeepDive帮助构建知识图谱
neo4j开源的图数据库产品
五、知识图谱的补全
可以预测缺失的是谁
将两个知识图谱对齐(概念层、实例层)