(Always to be continued…)
因为作者刚刚开始,很多不懂的基础概念需要理解,未来也必将遇到更多的概念,自己也会不断更新。当然,文中如果有不妥的地方,希望读者能提醒校正,共同学习,万分感谢。
实体对齐
指解决不同名称指代同一个物体的过程,即 万达董事长 和 王健林 是指代的同一个人,这两个代词要对齐。
实体消歧
指同样的名称可能指代多个物体,即说苹果时 可能是 吃的苹果,也可能是苹果公司。
关系抽取(relation)
entity 和 entity之间的边,即实体与实体之间的联系,比如姚明是人,姚明和人是实体。
属性抽取(property)
指实体的固有属性边,比如颜色等固有属性。
概念抽取
所谓概念,是指对一个entity的上位词类型的抽取,比如说,刘德华是歌手,也是演员,歌手和演员都是作为类别的一种,相对于刘德华这个具体事例,他们俩就是概念。
知识融合
将多个图谱进行融合
知识推理
由于语料缺失而不能得到的关系,通过算法来弥补推理进而添加这些缺失的关系,称之为知识推理。
本体(ontology)
一种抽象概念,是一系列规则的集合,符合这些规则的东西都可以被划归为一个类属。
Reference:关于什么是ontology可以参考这篇文章。
那么其实这个看起来和KG中的概念分类(taxonomy)相似。
分类(taxonomy)
一种严格的层级式的分类方式,不同类种可以按照概念严格区分,比如可以生物学对动物的分类,是一个层级式的,每种动物都可以对应到唯一的具体类种。
taxonomy & ontology 区分
简单点可以这样理解二者区别:
taxonomy is usually only a hierarchy of concepts (i.e. the only relation between the concepts is parent/child, or subClass/superClass, or broader/narrower)
in an ontology, arbitrary complex relations between concepts can be expressed too (X marriedTo Y; or A worksFor B; or C locatedIn D, etc )
Reference:关于二者的区别可以参考这篇文章 。