碎片笔记｜可训练&非自回归解码策略

_Meilinger_

于 2023-08-31 17:16:00 发布

阅读量422

点赞数 1

分类专栏：碎片笔记文章标签：解码策略自然语言生成 NLG 非自回归解码策略

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36332660/article/details/132337358

版权

碎片笔记专栏收录该内容

46 篇文章 2 订阅

订阅专栏

前言：前段时间在和学长的一次讨论中听他偶然提到一句可训练的解码策略，觉得很新鲜，于是便有了这篇文章。本文大致讲述一下可训练解码策略的发展历程及几个经典工作的思路。（本文初稿写于2023年3月16日）

常规的解码策略一般指自回归式解码策略，主要包括：贪婪搜索、集束搜索、top-k以及top-p采样，其主要思想是参照已生成的信息逐个生成文本，由于不是本文重点，这里不展开介绍，详细内容参见本篇博客。

目录

解码策略优化方向

解码策略优化方向

解码策略的优化方向有很多，比如风格转换、解码速度、提高丰富性等，下面就根据解码策略的优化方向为分类依据对现有工作展开介绍。

风格转换

一个精心设计的解码策略也可以当作是可控文本生成的一种方法。比如控制生成文本的风格、情绪等信息。

解码速度

注意阐明是对哪种解码策略进行改进

Speeding Up Neural Machine Translation Decoding by Shrinking Run-time Vocabulary (ACL, 2017)
主要思想：通过在测试阶段缩减词表提高解码速率

Noisy Parallel Approximate Decoding for Conditional Recurrent Language Model (2016 arXiv) 纽约大学（Kyunghyun Cho）
主要思想：Noisy Parallel Approximate Decoding

非自回归解码策略

通过并行生成文本，提高解码速度。最大特点就是并行，也是因为并行，解码速度大大提升。（重点关注文中是以什么代价换取的速率提升）

Trainable Greedy Decoding for Neural Machine Translation (EMNLP, 2017) 香港大学纽约大学（Kyunghyun Cho）
主要思想：使用强化学习的方法设计一个可训练贪婪解码策略

A Stable and Effective Learning Strategy for Trainable Greedy Decoding (ACL, 2018) 香港中文大学；纽约大学（Kyunghyun Cho）
主要思想：在几乎不增加计算开销的前提下，将集束搜索功能发挥到最大

Retrieving Sequential Information for Non-Autoregressive Neural Machine Translation (ACL, 2019) 中科院
主要思想：在纯非自回归模型和自回归模型之间取一个折中，添加一个序列信息模块

参考资料

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
碎片笔记｜可训练&非自回归解码策略

碎片笔记｜可训练&非自回归解码策略
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

_Meilinger_ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。