2022年文本生成综述

夏殇0808

已于 2022-11-07 18:02:58 修改

阅读量1k

点赞数

分类专栏： NLG 学习笔记文章标签：深度学习人工智能

于 2022-11-07 18:02:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012328476/article/details/127735832

版权

该文综述了文本生成领域的最新进展，包括输入编码表示的非结构化、结构化和多模态输入，预训练模型的经典结构与扩展，以及生成模型的优化方法。文章探讨了如何在多语言、结构化数据和多模态输入中处理输入表示，如图学习、注意力机制和编码器结构。此外，还讨论了预训练模型如Masked Language Model、Causal Language Model和Encoder-decoder Language Model的设计，并介绍了Fine-tune、Prompt Tune和Property-Tuning等优化技术。

摘要由CSDN通过智能技术生成

A Survey of Pretrained Language Models Based Text Generation
https://arxiv.org/abs/2201.05273

目录

一、对输入的编码表示

1.1 非结构化输入

1.1.1 段落级别

1.1.2 文档级别

1.1.3 多语言

1.2 结构化输入

1.3 多模态输入

1.3.1 Image Caption

1.3.2 Video Caption

1.3.3 Speech Recognition

二、预训练模型的设计

2.1 经典结构

2.1.1 Masked Language Model

2.1.2 Causal Language Model

2.1.3 Prefix Language Model

2.1.4 Encoder-decoder Language Model

2.2 结构扩展

2.2.1 附加Embedding

2.2.2 注意力机制

三、生成模型优化

3.2 prompt tune

3.3 Property-Tuning

四、评价指标

人大的一篇综述，把文本生成的方法分成了三类：输入编码、模型设计、优化方法。这同时也从数据、模型、优化层面给出了一些比较实用的建议。

一、对输入的编码表示

本文主要从输入形态进行了划分。

1.1 非结构化输入

1.1.1 段落级别

Hierarchy-based：先对句子进行编码，再用一个编码器进行对句子表示进行聚合
Graph-based：相比于上面的序列化层次编码，图学习的方法可以更好地对不相邻的句子进行聚合

1.1.2 文档级别

同样使用层次化的方法
抽取关键信息：层次化方法自下而上，难免引入噪声，而更重要的是抓住整个文档的主题信息，可以用topic model或者设置更高级别的目标去做
提升效率：当文本过长时，可以使用局部注意力、稀疏注意力去提升效率，编码更长的内容

1.1.3 多语言

Cross-lingual：跨语言的思想是在整个语料上生成subword，并用一套embedding和encoder去编码多种语言，可以参考XLM
Multi-lingual：多语言的思想是多套embedding共用一个encoder，可以参考mBART、mT5

1.2 结构化输入

结构化输入在知识图谱的应用场景下很常见，编码器主要面临着三个问题。

预训练是用非结构化文本，而当前输入的是结构化文本，如何消除这个Gap？

预处理：把结构化数据拼成序列输入，比如「胡歌-职业-演员」变成「胡歌的职业是演员」
通过图学习或其他编码器，把输入变成embedding在喂给预训练模型，比如清华ERNIE

上述方法消除了Gap，但也丧失了结构带来的重要信息，如何保持这些特征呢？

通过加入新的目标，比如表格化的输入，让模型去预测每个数据的字段名，强迫模型编码进这些信息
直接把结构化信息加到输入里，比如上面的三元组例子，可以变成「<\S>胡歌</S><\P>职业</P><\O>演员</O>」
利用可以编码结构信息的encoder，比如图神经网络

一些场景下（比如报表生成），如何保持输出数据与输入的一致性？

加入额外的训练目标，去检测输入输出的一致性
使用Copy机制：pointer-generator是比较经典的方法
在输入侧加入更多限制，让模型学习到这些强pattern

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
2022年文本生成综述

通过综述梳理一下知识体系。
复制链接

扫一扫

专栏目录

夏殇0808 CSDN认证博客专家 CSDN认证企业博客

码龄11年

158: 原创

22万+: 周排名

130万+: 总排名

33万+: 访问

: 等级

4235: 积分

74: 粉丝

109: 获赞

39: 评论

390: 收藏

私信

关注

热门文章

分类专栏

笔记 9篇
NLG 35篇
联邦学习 1篇
pytorch 1篇
增强学习 6篇
工具类
tornado 1篇
学习笔记 121篇
python练习 6篇
machine learning 8篇
书摘 4篇
cpp 13篇
spark 6篇
git 3篇
SQL 9篇
installation questions 1篇
Linux 10篇
leetcode 3篇
algorithm 9篇
unsolved 1篇

最新评论

源码阅读-CVAE模型
dream collector.: 请不要抄苏剑林的文章
源码阅读-CVAE模型
Zoe_807: 大佬，源码可以发我一份嘛？
chatgpt在复杂问题的回答表现
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/615562980。
chatgpt在复杂问题的回答表现
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 程序员有哪些绝对不能踩的坑？: https://activity.csdn.net/creatActivity?id=10433?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
论文阅读-Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitiv
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。