深度学习神经网络学习笔记-自然语言处理方向-论文研读-关系抽取-cnn

概念引入

有关中文实体命名识别
逻辑回归
线性回归
时间序列分析
神经网络
self-attention与softmax的推导
word2evc
glove

文章背景

1.在本文之前,关系提取主要依赖于统计机器学习方法,其性能是高还是低
这取决于提取特征的质量。
2.特征提取依赖于现有NLP系统的输出,这将导致错误在现有NLP工具中传播
依赖NLP工具
3.任务依赖性导致复杂的培训

信息抽取主要包括以下子任务

  • 命名实体识别
  • 关系抽取:我们一般讲的三元组(triple)抽取,主要用于抽取实体间的关系
  • 事件抽取:相当于一种多元关系的抽取

在这里插入图片描述
关系抽取(Relation Extraction, RE)是自然语言处理的任务之一。该任务的定义是,给定标注了两个实体的句子,返回两个实体之间的语义关系。比如,给定句子“1993年2月15日,李彤出生在吉林某城市。”,其中和标签表示实体标注,返回关系“人-出生地”。关系抽取任务得到的结果常用于问答系统和知识图谱等应用,是基础且重要的自然语言处理任务。

研究成果

  • 词汇层面特征与句子层面特征
  • 位置特征(PF)用于编码当前单词和目标单词对之间的相对距离
  • 融合词向量信息,更好的上下文提取模型
  • 实验是在semeval-2010 task 8数据集上进行的,当时获得了最好的结果
    提出了CNN网络结构来解决端到端关系识别问题

关系抽取分类

在这里插入图片描述
有监督的关系抽取任务:

  • Pipeline:将实体抽取与关系抽取分为两个独立的过程
  • Joint Model:实体抽取与关系抽取同时进行,通常用模型参数共享的方法来实现
    在这里插入图片描述

关系抽取方法

在这里插入图片描述

关系抽取的挑战

  • 数据规模
  • 学习能力
  • 复杂语境
  • 开放关系

该模型的结构

在这里插入图片描述
基于预先训练好的词向量
通过CNN网络融合位置信息提取句子级别的特性
结合句子特点和语法特点进行系统分类

语法特征

在这里插入图片描述

句法特征

在这里插入图片描述
在这里插入图片描述

Pf表示当前单词与实体单词1和实体单词2之间的相对距离。该相对距离还映射到D维向量,该向量是随机的初始化。
例如:[People]0 have1 been2 moving3 back4 into5 [downtown]6。moving到people和
downtown的相对距离分别为3和-3
在这里插入图片描述

结果分析

在这里插入图片描述
SemEval-2010 Task 8 dataset

在这里插入图片描述
参数设置
在这里插入图片描述
在这里插入图片描述
没有复杂的NLP工具,在这种情况下,模型实现了更好的性能,结果通过假设检验

位置特征对比测试集有明显提升
在这里插入图片描述

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丰。。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值