Richpedia: A Large-Scale, Comprehensive Multi-Modal Knowledge Graph
一、Richpedia是一个图像多模态知识图谱,顾名思义实体分为了文本实体和图像实体,由这些实体构成三元组。论文介绍了Richpedia的建立过程,包括了数据收集、图像处理和关系挖掘。
图1 构建流程
1、数据收集:
text实体来自Wikipedia,图像是通过Google,Yahoo和Bing来搜索text实体爬取的。Wikipedia中每个实体包含了唯一的IRI,文中提到将这些IRI添加到Richpedia,而非实体本身。最终一共收集了20638个关于城市、景点和名人的实体。(这里用IRI的原因就是为了后期使用的时候可以直接在Wikipedia上查询)
对于图像实体,直接从Wikipedia收集,然后在Richpedia创建对应的IRIs。作者一共收集了2883162个实体的图像,平均每个实体保留99.2个。
收集完两种实体,生成三元组,文中生成了三种三元组。第一种,(ei, rp:imageof, ek)图像实体ei是KG实体ek的图像。(图像与文本的关系imageof);第二种,(ei, rp