对DBpedia各子数据集特点分析
数据地址见DBPedia官网。
Mainly From DataSet 3.0 ,一般同样的数据集,版本越新,size越大。
article_categories 2.0GB 关系只有一种类型,二分图,主语和谓语没有交集,形如:
主 谓 宾
Image 1.3GB ,每5行描述一个Image,为一个单元,单元与单元之间没有关联,sample如下:
<<images_1.3G_sample_and_Chinese_description.nt>>