2022年文本生成综述

该文综述了文本生成领域的最新进展,包括输入编码表示的非结构化、结构化和多模态输入,预训练模型的经典结构与扩展,以及生成模型的优化方法。文章探讨了如何在多语言、结构化数据和多模态输入中处理输入表示,如图学习、注意力机制和编码器结构。此外,还讨论了预训练模型如Masked Language Model、Causal Language Model和Encoder-decoder Language Model的设计,并介绍了Fine-tune、Prompt Tune和Property-Tuning等优化技术。
摘要由CSDN通过智能技术生成

A Survey of Pretrained Language Models Based Text Generation
https://arxiv.org/abs/2201.05273

目录

一、对输入的编码表示

1.1 非结构化输入

1.1.1 段落级别

1.1.2 文档级别

1.1.3 多语言

1.2 结构化输入

1.3 多模态输入

1.3.1 Image Caption

1.3.2 Video Caption

1.3.3 Speech Recognition

二、预训练模型的设计

2.1 经典结构

2.1.1 Masked Language Model

2.1.2 Causal Language Model

2.1.3 Prefix Language Model

2.1.4 Encoder-decoder Language Model

2.2 结构扩展

2.2.1 附加Embedding

2.2.2 注意力机制

三、生成模型优化

3.1 finetune

3.2 prompt tune

3.3 Property-Tuning

四、评价指标


人大的一篇综述,把文本生成的方法分成了三类:输入编码、模型设计、优化方法。这同时也从数据、模型、优化层面给出了一些比较实用的建议。

一、对输入的编码表示

本文主要从输入形态进行了划分。

1.1 非结构化输入

1.1.1 段落级别

  1. Hierarchy-based:先对句子进行编码,再用一个编码器进行对句子表示进行聚合
  2. Graph-based:相比于上面的序列化层次编码,图学习的方法可以更好地对不相邻的句子进行聚合

1.1.2 文档级别

  1. 同样使用层次化的方法
  2. 抽取关键信息:层次化方法自下而上,难免引入噪声,而更重要的是抓住整个文档的主题信息,可以用topic model或者设置更高级别的目标去做
  3. 提升效率:当文本过长时,可以使用局部注意力、稀疏注意力去提升效率,编码更长的内容

1.1.3 多语言

  1. Cross-lingual:跨语言的思想是在整个语料上生成subword,并用一套embedding和encoder去编码多种语言,可以参考XLM
  2. Multi-lingual:多语言的思想是多套embedding共用一个encoder,可以参考mBART、mT5

1.2 结构化输入

结构化输入在知识图谱的应用场景下很常见,编码器主要面临着三个问题。

预训练是用非结构化文本,而当前输入的是结构化文本,如何消除这个Gap?

  1. 预处理:把结构化数据拼成序列输入,比如「胡歌-职业-演员」变成「胡歌的职业是演员」
  2. 通过图学习或其他编码器,把输入变成embedding在喂给预训练模型,比如清华ERNIE

上述方法消除了Gap,但也丧失了结构带来的重要信息,如何保持这些特征呢?

  1. 通过加入新的目标,比如表格化的输入,让模型去预测每个数据的字段名,强迫模型编码进这些信息
  2. 直接把结构化信息加到输入里,比如上面的三元组例子,可以变成「<\S>胡歌</S><\P>职业</P><\O>演员</O>」
  3. 利用可以编码结构信息的encoder,比如图神经网络

一些场景下(比如报表生成),如何保持输出数据与输入的一致性?

  1. 加入额外的训练目标,去检测输入输出的一致性
  2. 使用Copy机制:pointer-generator是比较经典的方法
  3. 在输入侧加入更多限制,让模型学习到这些强pattern
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值