ACL 2023 | 用二分类解决无监督常识问答

最新推荐文章于 2024-07-08 00:31:23 发布

PaperWeekly

最新推荐文章于 2024-07-08 00:31:23 发布

阅读量711

点赞数

文章标签：分类机器学习人工智能深度学习数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/130998335

版权

本文提出BUCA，一个无监督的常识问答（UCR）二分类框架，通过将知识图谱三元组转化为文本，生成正负样本对预训练语言模型进行微调，使用对比学习增强模型的推理能力。BUCA在多个常识QA基准上表现出色，且数据需求较少，显示了其在无监督场景中的有效性。

摘要由CSDN通过智能技术生成

常识推理最近在自然语言处理研究中引起了广泛关注，现有的常识推理方法一般分为两种：一种是在开源数据集上对大型语言模型进行微调 [1]，另一种是借助外部知识图谱来训练。然而，构建有标注的常识推理数据集既昂贵，又受限于特定领域，所以尝试无监督常识推理（UCR）至关重要。

本文中，作者专注于无监督多项选择题 QA 任务，也即给定一个问题和一组答案选项，使模型需要预测最可能的选项。作者提出了一种名为 BUCA 的无监督常识 QA 二分类框架，首先使用手动编写的模板将知识图谱三元组转化为文本形式，并生成正面和负面的问题-答案对，然后对预训练好的语言模型进行微调，并在微调过程中加入对比学习来提升模型识别不合理答案的能力，最终选择最高合理性分数的答案作为预测答案。

大量的实验结果表明，BUCA 框架在多个 QA benchmark 上都取得了令人满意的性能，并且相较于现有 UCR 方法，本文的框架对数据的要求更少，展现了 BUCA 框架的有效性。了作者的方法在各种多项选择题回答基准上的有效性。

论文标题：

BUCA: A Binary Classification Approach to Unsupervised Commonsense Question Answering

论文链接：

https://arxiv.org/abs/2305.15932

代码链接：

https://github.com/probe2/BUCA

Method

作者专注于多项选择题 QA 任务：给定一个问题和一组选项，模型应选择最有可能的单个答案。特别地，本文考虑无监督情境下的 QA 任务，也即默认模型无法访问训练或验证数据。

本文分为如下三个部分介绍 BUCA 框架：三元组转化为二分类问题；训练损失设计以及下游任务推理。

1.1 三元组转化

一般地，一个知识图谱可以表示为三元组，其中是一组实体，是一组关系类型，是一个三元组集合，其中分别为头实体和尾实体，则是连接的关系。

受到之前的研究启发 [2]，每个知识图谱三元组都可以通过预定义的模板转化为 Q-A 对，这些 Q-A 对可以被用作分类任务的输入，例如：

(PersonX thanks PersonY afterwards, isAfter, PersonX asked PersonY for help on her

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。