一篇大模型可控文本生成技术最新综述

全面概述用于控制大型语言模型 (LLM) 中的文本生成的技术和方法,重点是理论基础和实际实现。

大模型可控文本生成(CTG)综述

图片

图片

可控文本生成的需求

可控文本生成(CTG)必须满足两个主要要求:

  • 满足预定义的控制条件:确保生成的文本符合指定的标准,例如主题一致性、安全性和风格一致性。

  • 保持文本质量:确保生成的文本流畅、有用且多样化,同时平衡控制和整体质量。

与大语言模型中的可控生成相关的Web of Science上的出版趋势

图片

大型语言模型(LLMs)的可控性维度和能力维度

图片

可控文本生成的形式化定义

对CTG的定义如下:

  • 与 LLM 能力的关系:CTG 是一个与 LLM 的客观知识能力正交的能力维度,侧重于如何呈现信息以满足特定需求,例如风格或情感。

  • 控制条件的注入:可以使用文本语料库、图表或数据库等资源将控制条件集成到文本生成过程的各个阶段。

  • CTG 的质量:高质量的 CTG 在遵守控制条件和保持生成文本的流畅性、连贯性和有用性之间取得平衡。

可控文本生成任务

对可控文本生成(CTG)的任务进行了分类,主要分为以下两个大类:

  1. 内容控制(Content Control):也称为语言学控制或硬控制,专注于生成文本的具体元素,如文本的结构和词汇。这种类型的控制要求模型根据预定义的规则精确生成文本内容。内容控制包括:

    • 结构控制:包括特定格式(如诗歌、食谱等)、组织结构(如段落划分、标题使用、列表排列)和长度控制。

    • 词汇控制:确保文本包含预定义的关键词集,以及避免使用可能有害或不适当的术语。

  2. 属性控制(Attribute Control):也称为语义控制或软控制,关注文本的抽象语言属性,如情感、风格和主题。这种类型的控制旨在确保生成的文本在更高层次上反映特定的语义特征。属性控制包括:

    • 安全性控制:包括去除有害内容和遵守法律法规。

    • 情感控制:确保文本表现出明确的情感倾向,如积极、消极或中性。

    • 风格控制:包括通用风格(适应特定场合和行业的专业沟通风格)和个人风格(模仿特定写作风格或根据个人喜好生成个性化文本)。

    • 主题控制:确保文本严格遵守指定的主题。

4.可控文本生成方法分类

干预阶段、控制方法、特定方法和示例方法的分类

图片

可控文本生成(CTG)方法分类:

  • 模型驱动方法:使用分类器、条件语言模型或直接从LLMs本身注入知识。

  • 数据驱动方法:利用丰富的数据资源,如文本语料库、词典、图和数据库来注入知识。

CTG中条件的注入

图片

可控文本生成(CTG)的方法主要分为两个阶段训练阶段和推理阶段

可控文本生成方法的分类

图片

训练阶段方法

  1. 重训练(Retraining):从头开始训练新模型或对现有模型架构进行根本性修改,以更好地适应特定的控制条件。这通常在现有预训练模型无法满足新要求时采用。

  2. 微调(Fine-Tuning):通过使用专门设计的小型数据集来调整预训练模型,使其更好地符合特定的控制属性,而无需从头开始训练模型。

  3. 强化学习(Reinforcement Learning):使用奖励信号来引导模型输出朝向特定的控制目标。通过迭代优化,模型学习使其输出与这些目标对齐。

推理阶段方法

  1. 提示工程(Prompt Engineering):在推理阶段,通过设计特定的输入提示来直接影响文本生成,而无需对模型参数进行广泛调整。

  2. 潜在空间操作(Latent Space Manipulation):通过调整模型隐藏层中的激活状态来控制生成的文本,允许在不改变模型权重的情况下精确控制文本生成过程。

  3. 解码时干预(Decoding-time Intervention):在解码过程中修改生成输出的概率分布或应用特定规则,以影响单词选择,确保输出与特定控制条件对齐。

具体方法示例

  • 重训练:例如CTRL模型,通过在训练文本前添加控制代码来区分不同的控制条件。

  • 微调:例如Adapter-Based Fine-Tuning和Data-Driven Fine-Tuning,使用辅助模型或特定数据集来调整模型输出。

  • 强化学习:例如Automated Feedback和Human Feedback方法,使用自动评估指标或人类反馈来优化模型。

Controllable Text Generation for Large Language Models: A Surveyhttps://arxiv.org/pdf/2408.12599https://github.com/IAAR-Shanghai/CTGSurvey

来源 | PaperAgent

  • 12
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值