知识图谱与NLP
文章平均质量分 67
知识图谱与NLP
Norstc
这个作者很懒,什么都没留下…
展开
-
机器学习中的MR和MRR
设有一个test集,大小为M,对其进行分类,label的数目共有N个。那么预测结果共有M个,每个结果是对于N个label的评分,设第i个test目标的groud-truth排名为。MR(Mean Rank,平均排名):MRR(Mean Reciprocal Rank,平均倒数排名):可见,MR越小越好,MRR越大越好。MR的取值范围:MRR的取值范围:,(注意倒数,即1除以原数,而不是倒着数)举例:N=1000,M=10,eg1:排名结果是前9个都是1,最后一个是原创 2022-03-29 20:05:16 · 4079 阅读 · 0 评论 -
剖析知识图谱:实体的出度与入度
Digging into KG: the indegree and outdegree of entity.零:前言知识图谱以三元组的方式存储知识,所有知识图谱的知识条目共同形成了一个由知识实体作为节点、实体间的关系作为边的图结构。所以本质上,知识图谱是一个图。相较于一般的图,知识图谱的结构往往具有一定的特殊性,这与其描述的一类知识相关。比如层级性:animal→hypernym→dog,animal→hypernym→cat层级性在数据结构上表现为树结构。在常见的公用数据集中,WN原创 2022-02-19 10:28:55 · 2937 阅读 · 3 评论 -
常用知识图谱数据集FB15K, YAGO, WN18
一 FB15K-237FB15k-237共14541个实体,237种关系,它是FB15K的子集,FB15K又是Freebase数据集的子集详细见:FB15K-237知识图谱数据集的介绍与分析,Freebase二 WN18rrWN18rr是从WordNet抽取的子集,共40943个实体,11种关系。关系列表如下:0 _hypernym1 _derivationally_related_form2 _instance_hypernym3 _also_see4 _member原创 2021-10-28 22:16:39 · 18046 阅读 · 1 评论 -
知识图谱嵌入KGE 之 高斯嵌入模型
作者:AI科技评论链接:https://zhuanlan.zhihu.com/p/80149671来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。KG2E模型。He等人认为,知识库中的关系和实体的语义本身具有不确定性,而过去模型中都忽略这个因素。因此,He等人提出KG2E,使用高斯分布来表示实体和关系。其中高斯分布的均值表示的是实体或关系在语义空间中的中心位置,而高斯分布的协方差则表示该实体或关系的不确定度。图3为KG2E模型示例,每个圆圈代表不同实体与关系的.转载 2021-09-23 18:23:35 · 1309 阅读 · 0 评论 -
代码解析:Multi-Hop Knowledge Graph Reasoning with Reward Shaping
代码地址:MultiHopKG主文件:experiment.py主循环路径:experiment.py→main()→run_experiment(args)→train(lf)→run_train(train_data, dev_data)→learn_framework.py→run_train(self, train_data, dev_data)→ forward(dev_data)→self.predict(mini_batch)→pg.py→...原创 2021-09-10 15:40:22 · 608 阅读 · 0 评论 -
FB15K-237知识图谱数据集的介绍与分析,Freebase
FB15k是知识图谱Freebase的子集。整个Freebase知识图谱共有19亿个三元组,如下图。而FB15k是从Freebase中取出一小部分主题词组成的数据集,它的统计数据如下:主题词总数 14505 三元组总数 544230 关系的种类数 474 每个主题词的平均三元组数 37.5 注:FB15k存在着正反关系,他们意义相同,指向相反。上表的统计数据中,将一对正反关系视为两种不同的关系。...原创 2021-09-06 07:56:07 · 21242 阅读 · 4 评论 -
知识图谱 Freebase 的基本概念
本文简单介绍使用 Freebase 需要了解的基本术语和概念。 注意,Freebase 是已经被废弃的知识库,但是目前的科研工作大部分基于此知识库。一、图 GraphFreebase 的数据被存储在一个叫做图的数据结构中。一个图由边连接的结点组成。在 Freebase 中,结点使用 /type/object 定义,边使用 /type/link 定义。通过以图的形式存储数据,Freebase 可以快速遍历主题(topic)之间的任意连接,并轻松添加新的模式(schema),而无需改变数据的结构。原创 2021-08-31 20:18:08 · 4338 阅读 · 0 评论 -
DBpedia +Sparql快速入门
知识图谱分为科学知识图谱和Google知识图谱,前者就是根据论文分析作者、作者单位、关键字之间的关联关系。后者google把分词技术、贝叶斯分类等算法引入,对各种内容进行关联建库。其实都差不多!DBpedia是一个开源库,把Wiki百科的内容抽取,其实只是抽取一部分,也比较乱,不过也没有比它好太多的东西。开源,往往就是凑合——文化人叫做抛砖引玉!DBpedia有个sparql查询接口,https://dbpedia.org/sparql,有啥用呢?我觉得用于测试和学习sparql挺好。它有个关键字“转载 2021-07-11 20:27:49 · 2873 阅读 · 0 评论 -
HotpotQA 多跳问答数据集 Multi-hop QA
论文地址:HOTPOTQA: A Dataset for Diverse, Explainable Multi-hop Question Answering论文来源:EMNPL 2018问题介绍:问答(QA)的任务提供了一种可量化和客观的方法来测试智能系统的推理能力。而很多数据集却有以下不足,一,一些数据集主要关注在单段落,单文档,单跳的推理能力测试;二,基于知识库的数据集结构受限,问题与回答多样性弱;三,数据集中只有问题与回答,缺少对支持事实的标注,很难学习推导过程与可解释的预测。作者制作了一转载 2021-07-07 20:14:14 · 2397 阅读 · 0 评论 -
知识图谱问答(KBQA)数据集介绍
一、WebQuestions提出该数据集的论文:Semantic Parsing on Freebase from Question-Answer Pairs数据集地址:https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8aWebQuestions数据集(2013年提出)是由斯坦福大学研究人员通过Google Suggest API构建得到的,数据集本身共包含5810条(问题,答案)对,其中简单问题转载 2021-06-27 16:37:12 · 1842 阅读 · 0 评论 -
AM and LM in ASR 语音识别中的声学模型和语言模型
转自知乎作者:王赟 Maigo链接:https://www.zhihu.com/question/35833334/answer/67944671来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 语音识别系统的目的,是把语音转换成文字。具体来说,是输入一段语音信号,要找一个文字序列(由词或字组成),使得它与语音信号的匹配程度最高。这个匹配程度,一般是用...原创 2018-12-24 10:16:11 · 6537 阅读 · 0 评论