- 博客(16)
- 收藏
- 关注
转载 AAAI 2019 | 基于分层强化学习的关系抽取
转自:Paperweekly现有的关系抽取方法大多是先识别所有实体然后再确定关系类型。但是这类方法并没有考虑到实体与关系之间的作用。本文应用分层强化学习框架来增强实体提及和关系类型之间的交互,将相关实体视为关系的集合。此外,该方法还解决了抽取重叠关系(Overlapping Relations)的问题。研究动机该研究主要解决的问题有两个: 1. 大部分现有的方法在实体被识别后才决策关系...
2019-04-09 10:58:18 1916 1
翻译 AAAI 2019——基于多层转换约束的联合抽取多三元组模型
AAAI 2019——Jointly Extracting MultipleTriplets with Multilayer franslation Constraints论文地址:https://www.aaai.org/Papers/AAAI/2019/AAAI-TanZhen.5454.pdf三元组抽取是自动化构建知识库的关键步骤,传统模型方法一般先处理实体识别,后处理关系分类,忽略了两...
2019-04-09 10:39:56 1785 1
原创 实体对齐
**实体(Entity)**是指客观存在并可相互区别的事物,包括具体的人、事、物、抽象的概念或联系,知识库中包含多种类别的实体。**实体对齐(Entity Alignment)**也被称作实体匹配(Entity Matching),是指对于异构数据源知识库中的各个实体,找出属于现实世界中的同一实体。实体对齐常用的方法是利用实体的属性信息判定不同源实体是否可进行对齐。近来,针对跨知识图谱(KG...
2019-04-09 09:45:37 9081
原创 文本摘要简介
文本摘要旨在将文本或文本集合转换为包含关键信息的简短摘要。文本摘要按照输入类型可分为单文档摘要和多文档摘要。单文档摘要从给定的一个文档中生成摘要,多文档摘要从给定的一组主题相关的文档中生成摘要。按照输出类型可分为抽取式摘要和生成式摘要。抽取式摘要从源文档中抽取关键句和关键词。按照输出类型可分为抽取式摘要和生成式摘要。抽取式摘要从源文档中抽取关键句和关键词组成摘要,摘要全部来源于原文。生成式摘...
2019-04-09 09:13:44 559
原创 利用neo4j创建知识图谱
导入实体csv文件USING PERIODIC COMMIT 10LOAD CSV FROM "file:///disease.csv" AS linecreate (a:疾病{diseaseId:line[0],name:line[1],type:line[2]})导入关系csv文件USING PERIODIC COMMIT 10LOAD CSV FROM "file:///r...
2019-04-08 19:19:05 2632 1
原创 支持向量机
法向量是空间解析几何的一个概念,垂直于平面的直线所表示的向量为该平面的法向量。SVM是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。支持向量机学习方法 可以从简单到繁杂分成三种:线性可分支持向量机(可以使用硬间隔最大化学习线性分类器)线性支持向量机(使用软间隔最大化学习),非线性支持向量机(使用核技巧...
2019-04-08 16:48:10 89
原创 二分查找法
只能在有序数据中进行查找有序列表中,将待查找值key与查找范围内(start~end)的中值srcArr[mid]作比较,有如下可能: • Key<=srcArr[mid],则将查找范围缩小到0~mid-1。 • 2.key>srcArr[mid],则将查找范围缩小到mid+1~end。 • 3.key==srcArr[mid],则返回mid。...
2019-04-05 17:12:41 106
原创 TF-IDF(词频-逆文件频率)
TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。**字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。**即一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越能够代表该文章.词频 (term frequency, TF)TF指...
2019-03-26 10:52:41 2120
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人