实体对齐相关概念
**实体对齐(entity-alignment):**判断不同知识图谱中的两个实体是否指向真实世界同一对象的过程,又称为实体匹配(entity-matching),实体解析(entity-Resolution)。
**知识库实体对齐:**对于相同或不同的知识库,判断两个实体是否指向同一个物理对象,然后合并相同的实体。
**实体对齐的目的:**融合异构KG中的知识。给定两个不同KG的实体集合E1,E2,EA的目的是找到对齐的实体的结合A={(e1,e2)∈ E1×E2|e1=e2},实体e1和e2是等价关系。
**两个集合相乘:**表示两集合的直积,又叫笛卡尔积。集合A和B的笛卡尔积用描述法可表示为A×B={(a,b)|a∈A,b∈B},通俗的讲,这个集合是A中的元素和B中的元素两两搭配形成的有序数对的集合
RDF:(Resource Description Framework),即资源描述框架,其本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种方法和手段。RDF形式上表示为SPO三元组,有时候也称为一条语句(statement),知识图谱中我们也称其为一条知识。
**种子:**出现在不同KG中的同义实体,即预先对齐的实体。
实体对齐数据集
DB15K :比较常用的数据集,南京大学提出的,包含 ZH-EN, JA-EN, FR-EN 三种跨语言的实体对齐语料。DBP15K数据集是从单个多语言数据库生成的。它的子集是根据特定语言生成的。跨多种语言链接的实体用作对齐方式。
DWY100K: