论文浅尝 | 一种基于对比微调的脚本事件预测生成方法

本文提出了一种新的脚本事件预测方法,通过以事件为中心的预训练和对比微调,增强模型对事件相关性的理解和判别能力。在MCNC任务上,该方法超越了现有基线。
摘要由CSDN通过智能技术生成

5dca80f9d0a7e1f81a917b07f7b2ed53.png

笔记整理:柴智华,东南大学硕士,研究方向为事件预测

链接:https://arxiv.org/pdf/2212.03496.pdf

1. 动机

脚本事件预测任务是指在给定上下文时,预测后续事件。这需要推断事件之间相关性的能力。最近的工作试图通过使用预训练的语言模型并结合外部知识(如篇章关系)来改进事件相关性推理。尽管取得了可喜的成果,但仍然存在一些挑战。首先,当前工作采用的预训练的语言模型忽略了事件级知识,导致无法很好地捕捉事件之间的相关性。其次,用篇章关系建模事件之间的相关性是有局限性的,因为它只能用篇章标记捕获事件之间的显式相关性,而不能捕获许多隐式相关性。

2. 贡献

本文的主要贡献包括:

1)本文为这项任务提出了一种新的生成方法,其中预训练的语言模型用以事件为中心的预训练目标进行微调,并在生成范式中预测下一个事件。

2)本文引入了一种新的事件级空白填充策略作为学习目标,将事件级知识注入到预训练的语言模型中,并设计了一种基于可能性的对比损失,迫使模型学习区分正确和错误的候选事件。

3)多项选择叙述完形填空(MCNC)任务的实验结果表明,本文的方法比其他最先进的

基于注意力机制的深度强化学习是一种结合了强化学习和深度学习方法,用于学习多跳关系路径并提高传统方法的效率、泛化能力和可解释性。\[2\]在这种方法中,注意力机制被引入以帮助模型关注重要的信息。通过深度学习和强化学习的结构化感知,模型可以根据已知实体和关系推断出未知实体,并生成清晰且可解释的输出。这种方法的目标是最大化长期的累积奖励值,以完成特定的任务。\[1\]注意力机制的引入可以帮助模型更好地处理信息超载问题,类似于人脑通过注意力来解决大量输入信息的问题。\[3\]通过结合注意力机制和深度强化学习,可以提高模型的性能和应用范围。 #### 引用[.reference_title] - *1* *3* [深度学习(五、注意力机制与强化学习以及目前主要应用)](https://blog.csdn.net/qq_14835271/article/details/124807173)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [论文浅尝 | ​ADRL:一个基于注意力机制的知识图谱深度强化学习框架](https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/106464131)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值