OpenKG数据逐一截图说明

本文详述了OpenKG中的多个数据集,包括OMAHA术语集、中文百科知识图谱、YAGO多语言知识库等,评估了数据集的大小、格式和可用性,适合了解和研究中文知识图谱的资源。
摘要由CSDN通过智能技术生成

目录

数据格式总览

第一页

OMAHA术语集样例 

webdatacommons数据集

中文症状库 热门

快雨-证券数据api

基于limes的中文知识图谱融合实战演练教程

国内主要中文百科知识图谱之间的链接数据集 热门

中文百科知识图谱Zhishi.me-提供Dump 热门

 Zhishi.me 热门

清华大学-科技知识图谱 热门

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

 

 

中文百科知识图谱-zhOnto-提供Dump 热门

基于CNSchema的城市知识图谱(交通数据) 热门

空气质量语义描述

第二页

OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)

百科人物概念与实例 热门

KG-Buddhism

音乐知识图谱 热门

日本餐厅数据 热门

 

 天气语义数据 热门

XLORE双语百科知识图谱 热门

 影视双语知识图谱 热门

中医医案知识图谱 热门

第三页

YAGO多语言知识库(包含中文) 热门

 

Microsoft Concept Graph

 

城市内涝语义数据 热门

BabelNet-多语言百科字典和语义网络 热门

中国旅游景点知识图谱 热门

人物类RDF知识 热门

疾病术语集 热门

 

 Linked Open Schema

 MulType

观测指标标识符逻辑命名与编码系统 

乳腺癌临床试验语义标注 

 第四页

Music 热门

新三板企业数据

 

突发事件知识图谱 热门

Clinga 热门

Zhishi.lemon

herbnet

 第五页

结论


数据格式总览

OpenKG共有86个数据集。

首先,我们看一下其格式的标签列表。

可能与三元组相关的标签(一个数据集可能有多个标签)的总计数为 51,不算特别多,所以我打算把每个数集看一下,看看有没有 满足大小在 1G-10G

 

所有数据集共有5页。

下面图片中红框为可能符合要求的,其余   绿框内为格式或大小肯定不符合要求的。

第一页

  下面我们一一来看第一页有可能可用的数据集

OMAHA术语集样例 

 下载后发现大小只有15k。

 

webdatacommons数据集

 

没有rdf格式的数据。 

 

中文症状库 热门

进行下载后总大小只有10M

快雨-证券数据api

 

基于limes的中文知识图谱融合实战演练教程

是一个教程,测试数据大小28M。

 

国内主要中文百科知识图谱之间的链接数据集 热门

 

 

上图中可以看到四个文件的大小。

 

中文百科知识图谱Zhishi.me-提供Dump 热门

 

大小2.64G

下载解压后打开发现有非常多的压缩文件,数据都压扁了:

打开看文件内容

 Zhishi.me 热门

 

对里面的所有可获取文件进行下载,发现和上一个数据集是一样的。

清华大学-科技知识图谱 热门

 

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

 

 分别点击三个浏览

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值