BERT在关系学习中的应用

羽_羊

已于 2024-12-04 11:55:10 修改

阅读量2.5k

点赞数 3

分类专栏：关系抽取文章标签： BERT Relation Extraction Matching the Blanks

于 2019-06-20 21:37:43 首次发布

本文链接：https://blog.csdn.net/m0_38031488/article/details/93136518

版权

13 篇文章

订阅专栏

该论文提出了一种基于Transformer的无监督关系学习方法，名为Matching the Blanks (MTB)。模型利用BERT对实体对之间的关系进行编码，通过在文本中替换实体为[BLANK]来训练，无需有监督数据。实验表明，这种方法在关系匹配和少量样本关系分类任务中表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Matching the Blanks: Distributional Similarity for Relation Learning（2019 ACL）

典型的关系抽取可以大致分为以下三类：

该论文主要依据关系的分布式假设，提出了一种直接从文本中学习关系表示的新方法。本文的主要贡献有以下两个方面：

该模型主要基于Transformer结构对实体对之间的关系进行编码。
该模型训练表示关系不需要任何的有监督数据或者是人类标注数据，只通过matching the blanks方法来训练模型（句子中的实体被特殊字符[BLANK]替换，其目标是使得关系表示相似，如果该文本关系表述中包含相同的实体对）。

Overview

Task definition

本文的目标是学习从文本关系表述到向量关系表示之间的一个映射关系。给定一个序列表示，其中，为其特殊的开始和结束表示符。和为其两个实体的token范围，其中。

一个关系表述就变成了三元组的形式: 。我们的目标是学习一个函数映射, ，将三元组形式的关系表述转化为固定长度的向量化表示h。

Architectures for Relation Learning

Relation Classification and Extraction Tasks

Relation Representations from Deep Transformers Model

在该文的所有实验中，均基于BERTLARGE模型，面向特定任务的loss来训练。该论文主要依据两个问题来进行关系表示:（1）在BERT中如何表示实体。（2）如何从BERT的输出中提取一个固定大小的向量来表示该关系。

Entity span identification

Fixed length relation representation

对于最后的关系向量表示hr，其实基于Transformer的最后隐层表示来生成的。

[CLS] token：与标准BERT中的保留字段相同，用于句子分类。
Entity mention pooling：hr由两个实体向量表示，拼接而成，。
Entity start state：当使用了Entity mention pooling，模型表示最后的关系仅通过将两个实体的开始标识向量拼接起来，。