Attention Guided Graph Convolutional Networks for Relation Extraction(ACL19) 阅读笔记

本文介绍了Attention Guided Graph Convolutional Networks (AGGCNs) 在关系抽取任务中的应用,强调了AGGCNs相较于传统模型的优势。AGGCNs采用软修剪策略将依赖树转换为加权图,通过自我注意力机制学习节点间关联。实验结果显示,AGGCNs在跨句n元关系提取和句子级关系抽取任务中表现出色,优于其他模型。
摘要由CSDN通过智能技术生成

论文报告

Attention Guided Graph Convolutional Networks for Relation Extraction(ACL19)

Motivation

关系抽取的目的是检测文本中实体之间的关系。他是自然语言处理中较为基础的任务,可以应用在生物医学知识发现、数据库检索等多种领域,同样也是智能问答、自然语言生成、阅读理解等领域的基础。

Related Work

现有的大多关系抽取模型可以分为两类,基于序列的和基于依赖的。基于序列的模型只对单词序列起作用,而基于依赖的模型将依赖树(语法树)合并到模型中。与基于序列的模型只能提取表面形式的局部句法关系相比,基于依赖的模型能够捕获较为深层次的非局部句法关系。

基于依赖的模型,如何构造依赖树(语法树)的结构很大程度上影响了语法树最终的性能。有人提出了基于规则的剪枝的方法去掉一些冗余的信息。然而基于规则的剪枝策略可能会消除整个树中的一些重要信息,理想情况下,模型应该学会如何在全树中包含和排除某些信息之间保持平衡。在该文中,提出了一种基于attention的图卷积网络(AGGCNs),他直接作用于全树。开发了一种软修剪的策略,将原始依赖树转换为全连接的加权图。这些权重可以被视为节点之间的关联强度,可以通过使用self-attention的机制进行端到端的方式学习。

How?
  • GCN

    对于一个n个节点的图,我们用A来表示它的邻接矩阵,如果节点i和节点j之间有边则 A i , j = 1 A_{i,j}=1 Ai,j=1,对于无向图 A j , i = 1 A_{j,i}=1 Aj,i=1,无边则为0。则节点i在第l层的卷积运算 h i ( l ) \mathbf{h}_{i}^{(l)} hi(l)定义为:
    h i ( l ) = ρ ( ∑ j = 1 n A i j W ( l ) h j ( l − 1 ) + b ( l ) ) \mathbf{h}_{i}^{(l)}=\rho\left(\sum_{j=1}^{n} \mathbf{A}_{i j} \mathbf{W}^{(l)} \mathbf{h}_{j}^{(l-1)}+\mathbf{b}^{(l)}\right) hi(l)=ρ(j=1nAijW(l)hj(l1)+b(l))
    其中 W ( l ) \mathbf{W}^{(l)} W(l) b ( l ) \mathbf{b}^{(l)} b(l)是模型中的参数, ρ \rho ρ是激活函数本文用的(RELU), h i ( 0 ) \mathbf{h}_{i}^{(0)} hi(0)是初始的输入 x i x_i xi,其中 x i ∈ R d \mathbf{x}_{i} \in \mathbb{R}^{d} xiRd,d是输入的特征维度。

    image-20200310204402519

    图1
    如图一所示,AGGCN模型由M个相同的block组成,每个block包含三层,Attention Guided Layer、Densely connected layer、linear combination layer。
  • Attention Guided Layer

    如图一所示,传统的基于规则的剪枝方式边的权重只包含0或1,而AGGCN添加attention之后每个单词之间就有了关系。
    A ~

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Attention-guided CNN for image denoising》是一种用于图像去噪的神经网络模型。它基于卷积神经网络(CNN)的基本架构,但引入了注意力机制来提高去噪的效果。 在传统的CNN中,输入图像经过一系列卷积和池化操作,通过多个卷积层和全连接层进行特征提取和分类。然而,在图像去噪任务中,图像中不同区域的噪声水平可能不同,因此传统的CNN在对整个图像进行处理时可能无法有效地去噪。 为了解决这个问题,注意力机制被引入到CNN中。注意力机制可以将网络的注意力集中在图像的不同区域,以便更有针对性地去噪。该模型通过引入注意力模块,在每个卷积层之后对特征图进行处理,以增强重要区域的特征表示。这种注意力机制能够在去噪任务中更好地保留图像的细节和边缘,提高去噪效果。 具体来说,注意力模块通过学习图像的空间注意力和通道注意力来选择性地加权特征图。空间注意力用于选择特征图中的重要区域,而通道注意力用于选择特征图中的重要特征通道。通过这种方式,网络可以更加自适应地选择图像中重要的特征表示,从而更好地去除噪声。 实验证明,使用注意力机制的CNN模型在图像去噪任务上具有更好的性能。它在不同的噪声水平和噪声类型下都能够有效地去噪,并且能够保持图像的细节和结构。因此,这个注意力引导的CNN模型在图像去噪任务中具有一定的应用前景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值