论文总结 | Dialogue-Based Relation Extraction

最新推荐文章于 2024-06-17 09:49:47 发布

J.M_

最新推荐文章于 2024-06-17 09:49:47 发布

阅读量497

点赞数 1

本文链接：https://blog.csdn.net/Ming_Fan1/article/details/109168016

版权

原文链接：https://www.aclweb.org/anthology/2020.acl-main.444.pdf

摘要

提出了人工标注的基于关系抽取（RE）数据集对话框，旨在支持对出现在对话中的两个参数之间关系的预测。
通过对语料库和传统任务的异同分析，认为说话人相关信息（speaker-relatted information）在任务中起着至关重要的作用。
考虑到会话中交流的及时性，我们设计了一种新的度量方法来评估会话环境下RE方法的性能。并研究了几种具有代表性的RE方法的性能。
实验结果演示，在性能最好的模型上进行speaker-aware扩展，在标准环境和绘画环境下性能均提升。

1.介绍

主要工作

（1）提出了人工标注的基于关系抽取数据集DialogRE；
（2）比较基于对话的关系抽取任务和传统关系抽取任务的异同。
（3）设计新的度量方法评估交互会话的时效性。
（4）在数据集DialogRE上，使用标准的基于学习的关系抽取技术建立baseline。
（5）证实明确对话者在基于对话的关系抽取任务中的重要性。

2.数据集

数据集源于《Friends》中1788段对话，36种关系类型，10168个关系二元组（subject,relation type,object）。同时，标注了最小文本最小跨度。表1是一段对话的示例。

2.1 关系模式

主要关注PER和ORG；
由于数据集内容限制，删除SF任务定义的一些关系类型，同时增加一些关系类型，共36种，如表2.

2.2标注

定义

turn：regard an uninterrupted stream of speech from one speaker and the name of this speaker as a turn.
dialogue：the shortest snippet of contiguous turns that covers all annotated relational trips and sufficient supportive contests in this scene.

处理

如果说话者的全名或者其他名字出现在同一个对话中，我们将对话者作为一个关系元组的参数。如表1中关系R3
若一对参数有多种关系，每一个都标注。
如果有则标注一个触发词。如R1的触发词为brother，R3无触发词
标注反向的关系元组。如表1中R1和R2

2.3 负例生成，数据划分，匿名对话者

负例生成？？
训练集：验证集：测试集合=6：2：2
匿名对话者如表1中S1,S2

3.数据比较与讨论

3.1DialogRE vs SF

3.2DialogRE vs 现存关系元组

3.3触发词

4.模型和方法

4.1基于对话的关系抽取

对话D中，共有m条语句(turn)，表示为：D=s₁:t₁,s₂:t₂,…,s_m:t_m.有参数对(a₁,a₂).
标准模式：
把对话D看作文本d。
输入：a₁，a₂，d
输出：a₁，a₂ 之间的关系
评价标准：F1
会话模式：
把前 i 条语句看作 d 。
L基于整段对话(D)标注的关系集；R表示36种关系集。
定义辅助函数：

$j(x)=\begin{cases} m,& x未在D中出现 \\ i,& x在第i条对话中首次出现 \\ \end{cases}$
$i(r)=\begin{cases} j(\lambda_r), & r\in L,\lambda _r为关系r所标注的触发，\\ &即关系r的触发词\lambda _r首次出现的位置。 \\ m, & r\in L的其他情况 \\ 1, & r\in R-L \end{cases}$
定义一组关系类型，这些关系类型是基于E_i评估的：
$E_i=\{r|i\geq max\{j(a_1),j(a_2),i(r)\}\}$

（即，给定前 i 条语句组成的d，如果a₁，a₂，以及 $\lambda _r$ 在 d 中出现过，那么，基于a₁，a₂的关系类型 r 是可评估的，）

此定义基于假设：我们可以根据，能够清楚地表达关系的参数和触发器的位置，粗略估计我们需要多少条语句才能预测两个论点之间的关系。

输入：a₁，a₂，d(前 i 条语句，)
输出：O_i(a₁，a₂ 之间的关系)
评价标准：F_c

对于单个输入，有P_c，R_c定义如下：

取所有实例的均值作为最终的准确率和召回率。

4.2Baseline

Majority：
若未在训练集中出现，则输出训练集中频数最大的关系类型；
否则，输出训练集中关于此两个参数频数最大的关系类型。

CNN/LSTM/BiLSTM：
遵循Yao 的工作。https://www.aclweb.org/anthology/P19-1074/

BERT：
使用Radfordhttps://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf
的预训练语言模型和BERT。
输入串：[CLS] d [SEP] a₁ [SEP] a₂ [SEP]
[CLS]的隐藏向量C $\in R^H$ ，关系类型 $W_i \in R^H$ ，
基于 d 的关于实例 i 的a₁，a₂之间的关系的概率 $P_i=sigmoid(CW_i^t)$
使用交叉熵损失函数。

BERTs：
为了（1）帮助模型根据说话人姓名定位相关语句的起始位置；（2）避过拟合
输入串：[CLS] $\hat{d}$ [SEP] $\hat{a_1}$ [SEP] $\hat{a_2}$ [SEP]
$\hat{d}=\hat{s_1}:t_1,\hat{s_2}:t_2,...,\hat{s_n}:t_n$
[S₁],[S₁]是两个新引入的特殊短语
$\hat{s_n}=\begin{cases} [S_1], &s_i=a_1 \\ [S_2],& s_i=a_2\\ s_i,& 其他 \end{cases}$
$\hat{a_k}(k \in \{1,2\})=\begin{cases} [S_k],& 如果存在i使s_i=a_k\\ a_k,&其他 \end{cases}$

将BERT中的输入串做如下修改：（实现speaker-aware）
·对话者s_i处：如果对话者恰是所考察的两个论元之一，替换成新引入的短语[S₁]/[S₂]；
·对话内容不变；
·论元a₁/a₂：如果所考察的论元是对话者，那么将a₁/a₂替换成新引入的短语[S₁]/[S₂]

论文还做了其他3种输入串的尝试，效果没有上述好。

5.实验

略

J.M_

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
论文总结 | Dialogue-Based Relation Extraction

原文链接：https://www.aclweb.org/anthology/2020.acl-main.444.pdf摘要提出了人工标注的基于关系抽取（RE）数据集对话框，旨在支持对出现在对话中的两个参数之间关系的预测。通过对语料库和传统任务的异同分析，认为说话人相关信息（speaker-relatted information）在任务中起着至关重要的作用。考虑到会话中交流的及时性，我们设计了一种新的度量方法来评估会话环境下RE方法的性能。并研究了几种具有代表性的RE方法的性能。实验结果演示，在
复制链接

扫一扫