知识图谱之NELL数据集简介

最新推荐文章于 2025-04-14 12:10:57 发布

三石大数据

最新推荐文章于 2025-04-14 12:10:57 发布

阅读量7.2k

点赞数 6

分类专栏：知识图谱文章标签：自然语言处理 pytorch 机器学习深度学习知识图谱

本文链接：https://blog.csdn.net/qq_42397330/article/details/111466692

版权

知识图谱专栏收录该内容

9 篇文章

订阅专栏

本文介绍NELL数据集的结构与组成，包括训练、验证及测试集详情，以及实体与关系映射等关键信息。同时简要提及Wiki数据集。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 NELL数据集简介

来源：NELL

1.1 目录结构

train_tasks.json
dev_tasks.json
test_tasks.json
ent2ids
relation2ids
path_graph
e1rel_e2.json
rel2candidates.json

1.2 对应文件的解释

训练集：每个关系所在的三元组的数量在50到500之间 51个关系
验证集：每个关系所在的三元组的数量在50到500之间 5个关系
测试集：每个关系所在的三元组的数量在50到500之间 11个关系
所有实体对应id
除了训练集、验证集和测试集所有关系的关系所对应的id
除了训练集、验证集和测试集所有关系的关系所包含的三元组
存在于训练集、验证集和测试集中的所有关系对应的正确三元组
存在于训练集、验证集和测试集中的所有关系对应候选实体(根据实体类型的约束得到的)

1.3 数据探索

读取文件

train_tasks = json.load(open("FAAN/NELL/train_tasks.json"))
print(len(train_tasks))   # 51

ent2id = json.load(open('FAAN/NELL/ent2ids'))
print(len(ent2id))        # 68544

2 Wiki数据集简介

来源：Wiki

未完待续~~~

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

三石大数据

关注关注

6
点赞
踩
16

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

知识图谱的库

_Hope_

07-03

2467

语言知识图谱：WordNet事实性知识图谱：OpenCyc , Freebase , DBpedia , YAGO2领域知识图谱：人物之间的亲属关系Kinships，医学领域UMLS， Cora机器自动构建的知识图谱： Knowledge Vault NELL

NELL-995 知识图谱 数据集

03-28

Format of the dataset raw.kb: the raw kb data from NELL system kb_env_rl.txt: we add inverse triples of all triples in raw.kb, this file is used as the KG for reasoning entity2vec.bern/relation2vec.bern: transE embeddings to represent out RL states, can be trained using TransX implementations by thunlp tasks/: each task is a particular reasoning relation tasks/${relation}/*.vec: trained TransH Embeddings tasks/${relation}/*.vec_D: trained TransD Embeddings tasks/${relation}/*.bern: trained TransR Embedding trained tasks/${relation}/*.unif: trained TransE Embeddings tasks/${relation}/transX: triples used to train the KB embeddings tasks/${relation}/train.pairs: train triples in the PRA format tasks/${relation}/test.pairs: test triples in the PRA format tasks/${relation}/path_to_use.txt: reasoning paths found the RL agent tasks/${relation}/path_stats.txt: path frequency of randomised BFS

4 条评论您还未登录，请先登录后发表或查看评论

知识图谱综述

liangwqi的博客

08-30

5223

随着计算资源的廉价和语料知识资源的积累，知识图谱在各大企业逐步开始尝试使用。本文结合王昊奋和漆桂林老师的知识图谱课件以及复旦知识工厂课件，尝试对知识图谱做个综述。目录 知识图谱与语义技术概述语义网典型知识库项目简介 cyc：常识库 Wordnet：词性消歧词库 conceptnet：常识知识库 freebase： Wikidata： Dbpedia： Yago： Babe...

NELL系统：永远的语言学习与隐私保护迁移学习

最新发布

weixin_42497762的博客

04-14

384

本文探讨了NELL系统的永无止境的语言学习机制，以及差分隐私在迁移学习中的应用。NELL系统通过构建庞大的知识库，不断进行学习任务，并使用多视图协同训练、Horn子句耦合等方法连接不同概念，实现知识的保留与转移。而隐私保护迁移学习则关注如何在迁移学习过程中保护用户隐私，介绍了差分隐私的概念、算法以及在机器学习中的应用。

引文索引数据 nell_data.tar.gz

01-14

引文索引数据 nell_data.tar.gz ，包括很多引文索引文件，做引文分析时所用的数据

数据集

Neil的博客

03-24

887

UC Irvine Machine Learning Repository：（内含鸢尾花等） http://archive.ics.uci.edu/ml/index.php

NELL框架

jiangzhenkang的博客

12-07

4243

文章目录Never-Ending LearningAbstractIntroductionRelated WorkNerer-Ending-Learning举个例子，永动学习机NELL的学习问题实证评估最后讨论优势劣势缺陷 #信息抽取（Nell框架论文）标签（空格分隔）： 自然语言处理 Never-Ending Learning Abstract Introduction 机器学习作为AI的一...

NELL-995知识图谱数据集及其结构解析

NELL-995 知识图谱数据集是一个专为知识推理设计的资源集，它提供了丰富的语义关系和实体信息，旨在支持各种基于知识图谱的推理任务。本数据集的文件结构和内容，为我们理解和应用知识图谱、实体和关系表示学习、...

基于学习注意力的知识图关系预测嵌入数据集，包含FB15k-237，kinship，NELL-995，umls，WN18RR

12-12

FB15k-237、kinship、NELL-995、UMLS和WN18RR是当前在知识图谱研究领域广泛使用的一些标准化数据集。每个数据集都有其独特的特点和应用场景。 FB15k-237是Freebase知识库的一个子集，由Bordes等人首次提出，并在...

知识图谱（RDF）大型数据集 网络下载资源整合

wgd852372的博客

08-29

1万+

不定期更新一、DBPedia 简介： DBpedia 是一个很特殊的语义网应用范例，它从维基百科(Wikipedia)的词条里撷取出结构化的资料，以强化维基百科的搜寻功能，并将其他资料集连结至维基百科。透过这样的语意化技术的介入，让维基百科的庞杂资讯有了许多创新而有趣的应用，例如手机版本、地图整合、多面向搜寻、关系查询、文件分类与标注等等。DBpedia 同时也是世界上最大的多领域知...

知识图谱：12种通用知识图谱项目简介

u013250861的博客

05-23

1260

通用知识图谱大体可以分为百科知识图谱（Encyclopedia Knowledge Graph）和常识知识图谱（Common Sense Knowledge Graph）。百科知识图谱是百科事实构成的，通常是“非黑即白”的确定性知识。早在2010年微软就开始构建商用知识图谱，应用于旗下的搜索、广告、Cortana等项目。2012年谷歌基于Freebase正式发布Google Knowledge Graph。目前微软和谷歌拥有全世界最大的通用知识图谱，脸书拥有全世界最大的社交知识图谱。而阿里巴巴和亚马逊则

常用知识图谱数据集FB15K, YAGO, WN18

热门推荐

Norstc的博客

10-28

1万+

一 FB15K-237 FB15k-237共14541个实体，237种关系，它是FB15K的子集，FB15K又是Freebase数据集的子集详细见：FB15K-237知识图谱数据集的介绍与分析，Freebase 二 WN18rr WN18rr是从WordNet抽取的子集，共40943个实体，11种关系。关系列表如下： 0 _hypernym 1 _derivationally_related_form 2 _instance_hypernym 3 _also_see 4 _member

psl-er-product

05-13

知识图推理问题在此示例中，我们尝试根据嘈杂的事实和本体构建知识图。 数据集 该数据集最初来自CMU的永无止境的语言学习（NELL）项目。 NELL是一个大型知识图，试图从Internet上的自然语言中提取事实。该数据是Nell的一些原始提取器的输出（在将其添加到知识图之前）。起源该示例是Pujara等人的论文之一的简化版本：“知识图识别”： @conference {pujara:iswc13, title = {Knowledge Graph Identification}, booktitle = {International Semantic Web Conference (ISWC)}, year = {2013}, note = {Winner of Best Student Paper award}, author = {Pujara, Ja

清华大学-科技知识图谱数据集

12-17

43清华大学-科技知识图谱数据集 数据集 SciKG是一个以科研为中心的大规模知识图谱，目前包含计算机科学领域，由概念、专家和论文组成。其中，科技概念及其关系是从ACM计算分类系统中提取出来的，并辅以每个概念的定义（大多数来自维基百科）。http://unopencity.com/project/data-list?sec_cate=text-classifier&fir_cate=nlp

知识图谱数据集

qq_42310715的博客

09-06

810

可以在新闻推荐、问答系统中使用。

知识图谱-数据集

weixin_45486226的博客

05-10

1711

知识图谱常见数据集的一些介绍网址资源链接

技术动态 | 大模型时代下的知识图谱推理及评测数据集

开放知识图谱

05-24

1187

转载公众号| 老刘说NLP今天我们一起来看看知识图谱领域的知识推理问题，其数据有哪些，跟大模型结合怎么做。一、知识图谱领域中的知识推理任务界定知识图谱中的推理知识推理是指根据知识图谱中已有的知识，采用某些方法，推理出新的知识（知识图谱补全）或识别知识图谱中错误的知识（知识图谱去噪），前者专注于扩充知识图谱，后者专注于知识图谱内部已有三元组正确性的判断。进一步的，知识图谱补全，是给定三元组中任意两...

995+

weixin_41216686的博客

11-29

422

大数据分析-第九章 知识图谱

SpriCoder的博客

02-20

1万+

第九章 知识图谱