概念引入
有关中文实体命名识别
逻辑回归
线性回归
时间序列分析
神经网络
self-attention与softmax的推导
word2evc
glove
文章背景
1.在本文之前,关系提取主要依赖于统计机器学习方法,其性能是高还是低
这取决于提取特征的质量。
2.特征提取依赖于现有NLP系统的输出,这将导致错误在现有NLP工具中传播
依赖NLP工具
3.任务依赖性导致复杂的培训
信息抽取主要包括以下子任务
- 命名实体识别
- 关系抽取:我们一般讲的三元组(triple)抽取,主要用于抽取实体间的关系
- 事件抽取:相当于一种多元关系的抽取
关系抽取(Relation Extraction, RE)是自然语言处理的任务之一。该任务的定义是,给定标注了两个实体的句子,返回两个实体之间的语义关系。比如,给定句子“1993年2月15日,李彤出生在吉林某城市。”,其中和标签表示实体标注,返回关系“人-出生地”。关系抽取任务得到的结果常用于问答系统和知识图谱等应用,是基础且重要的自然语言处理任务。
研究成果
- 词汇层面特征与句子层面特征
- 位置特征(PF)用于编码当前单词和目标单词对之间的相对距离
- 融合词向量信息,更好的上下文提取模型
- 实验是在semeval-2010 task 8数据集上进行的,当时获得了最好的结果
提出了CNN网络结构来解决端到端关系识别问题
关系抽取分类
有监督的关系抽取任务:
- Pipeline:将实体抽取与关系抽取分为两个独立的过程
- Joint Model:实体抽取与关系抽取同时进行,通常用模型参数共享的方法来实现
关系抽取方法
关系抽取的挑战
- 数据规模
- 学习能力
- 复杂语境
- 开放关系
该模型的结构
基于预先训练好的词向量
通过CNN网络融合位置信息提取句子级别的特性
结合句子特点和语法特点进行系统分类
语法特征
句法特征
Pf表示当前单词与实体单词1和实体单词2之间的相对距离。该相对距离还映射到D维向量,该向量是随机的初始化。
例如:[People]0 have1 been2 moving3 back4 into5 [downtown]6。moving到people和
downtown的相对距离分别为3和-3
结果分析
SemEval-2010 Task 8 dataset
参数设置
没有复杂的NLP工具,在这种情况下,模型实现了更好的性能,结果通过假设检验
位置特征对比测试集有明显提升