国科大-自然语言处理复习

本文回顾了自然语言处理中的实体关系联合抽取,强调了流水线式与端到端方法的差异,介绍了检索式问答系统中的DocumentRetriever和DocumentReader,探讨了基于证据强度和证据覆盖的重排策略,以及端到端Retriever-Reader模型和预训练Retriever-Free方法。同时涵盖了情感分析中的联合三元组抽取和序列生成问题处理。
摘要由CSDN通过智能技术生成

谨以此博客作为复习期间的记录

实体关系联合抽取

流水线式

  • 流水线式抽取(Pipline): 把关系抽取的任务分为两个步骤,首先进行实体识别,再抽取出两个实体的关系。
    在这里插入图片描述

  • 联合抽取(Joint Extraction): 端到端,同时进行实体和关系的抽取。流水线式抽取会导致误差在各流程中传递和累加,而联合抽取的方式则实现难度更大

端到端方法

在这里插入图片描述
流水线式抽取和新标注策略的实体关系联合抽取都可以和序列标注结合起来,
在这里插入图片描述

在这里插入图片描述

检索式问答系统

流水线方式

Document Retriever 和 Document Reader 分两步

  • Document Retriever:通过TF-IDF检索维基百科中与问题相关的Top K个文档
  • Document Reader:将答案抽取转化为抽取式阅读理解问题
  • • 输入:一个文档段落,一个自然语言描述的问题
  • • 输出:段落中抽取的答案片段
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

论文中提出的模型结构主要包括两个阶段:信息检索(IR)和阅读理解(RC),以及两种答案重排方法:基于证据强度的重排和基于证据覆盖的重排。以下是这些模型组件的详细介绍:

信息检索(IR)阶段

  • 目标:检索与给定问题最相关的网页段落。
  • 方法:使用搜索引擎(例如谷歌或必应)来找到与问题最相关的顶级网页段落。
  • 特点:与标准阅读理解任务不同,在开放领域设置中,RC模型通常在远程监督下进行训练。这意味着在训练阶段,RC模型会将包含正确答案的所有段落与问题进行匹配

阅读理解(RC)阶段

  • 目标:从检索到的段落中提取答案。
  • 方法:使用阅读理解模型(例如R3模型)来从这些段落中提取候选答案。
  • 特点:与单个固定段落的标准阅读理解任务不同,开放领域问答需要处理多个段落,并从中提取候选答案

基于证据强度的重排

  • 目的:利用段落中出现答案的频率或概率来评估答案的强度。
  • 实现:计算每个答案在顶级答案候选中出现的次数,或者将RC模型为每个答案跨度分配的概率相加,以确定最终预测

基于证据覆盖的重排

  • 目的:根据不同段落的证据如何覆盖问题来排列答案候选。
  • 实现:首先将包含答案的段落连接成一个“伪段落”,然后使用匹配LSTM模型来衡量这个伪段落如何涵盖问题的各个方面

结合不同类型的聚合

  • 方法:将两种重排方法的输出进行加权组合,无需额外训练。
  • 特点:首先使用softmax重新归一化两种基于强度的重排器和一个基于覆盖的重排器提供的前5个答案得分,然后对相同答案的得分进行加权求和,选择得分最高的答案作为最终预测

这种结合信息检索、阅读理解和多种重排策略的方法充分利用了多个段落的证据,有效地提高了开放领域问答系统的性能。

端到端方式

Retriever-Reader的联合学习

Lee et al., Latent Retrieval for Weakly Supervised Open Domain Question Answering, ACL,2019
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

基于预训练的Retriever-Free方法

Petroni et al. Language Models as Knowledge Bases? ACL, 2019

情感分析

联合三元组抽取

将问题转为一个序列生成问题
统一输入输出的标准
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

A Unified Generative Framework for Aspect-Based Sentiment Analysis

  • 18
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Kilig*

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值