【ICML2023】基于自然语言指令的受控文本生成

INSTRUCTCTG是一个利用自然语言指令和演示来结合约束条件的文本生成框架。它通过提取文本中的约束,转化为指令来微调预训练语言模型,实现对不同约束的灵活控制,且不影响生成速度和质量。该框架还允许模型在无需重新训练的情况下适应新约束。
摘要由CSDN通过智能技术生成

17029797a2c8f5614ae035a082d1876a.png

来源:专知
本文为论文介绍,建议阅读5分钟在这项工作中,我们提出了INSTRUCTCTG,这是一个受控文本生成框架。

7cd17153f8a68688bd9ea3d5f07d502f.png

大型语言模型可以生成流畅的文本,并可以按照自然语言指令解决各种任务,而无需特定任务的训练。然而,要控制它们的生成以满足不同应用所需的各种约束条件是非常困难的。在这项工作中,我们提出了INSTRUCTCTG,这是一个受控文本生成框架,它通过依据约束条件的自然语言描述和演示来结合不同的约束条件。特别地,我们首先通过一组现成的自然语言处理工具和简单的启发式方法来提取自然文本中的潜在约束条件。然后,我们将这些约束条件转化为自然语言指令,以形成弱监督的训练数据。通过在输入之前添加约束条件的自然语言描述和一些演示,我们微调了一个预训练的语言模型,以包括各种类型的约束条件。与现有的基于搜索或基于评分的方法相比,INSTRUCTCTG 对不同类型的约束条件更加灵活,并且对生成质量和速度的影响要小得多,因为它不修改解码过程。此外,INSTRUCTCTG 还允许模型通过使用指令调整的语言模型的少量样本任务泛化和上下文学习能力来适应新的约束条件而无需重新训练。代码将在 https://github. com/MichaelZhouwang/InstructCTG 上提供。

3753a4ba78fd28e0bf1ee3e78f5ba32c.png

6b84aaf8f16bcd470874f2e3720ca706.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值