推测性解码（Predictive Decoding）

deepdata_cn

于 2024-07-12 07:30:00 发布

阅读量1.5k

点赞数 34

分类专栏：人工智能文章标签：推测性解码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43156294/article/details/140285713

版权

在这里插入图片描述

推测性解码（Predictive Decoding）是一种在自然语言处理（NLP）领域中使用的解码策略，特别是在机器翻译和文本生成任务中。它指的是在生成目标文本时，解码器会考虑之前已经生成的词或者短语，来预测接下来可能生成的词或短语。这种方法可以提高翻译或生成文本的流畅性和准确性。
推测性解码是一种用于大语言模型（LLM）推理加速的技术。
其主要思路是“先推测后验证”（Draft-then-Verify）：在每个解码步，该算法首先高效地“推测”目标 LLM 未来多个解码步可能生成的 token，然后用目标 LLM 同时验证这些 token，通过验证的 token 作为当前解码步的解码结果。
如果“推测”足够准确，推测解码就可以在单个解码步并行生成多个 token，从而实现 LLM 推理加速。并且，使用目标 LLM 的验证过程可以在理论上保证解码结果和目标 LLM 自回归解码结果的完全一致。

一、解码过程

推测解码目的是在每个解码步骤中，先生成多个可能的 token，然后使用目标大语言模型并行地评估这些 token，以加快推理速度。

生成：
- 在每个解码步骤中，推测解码算法首先会生成多个可能的 token，作为对目标大语言模型输出内容的推测。生成的内容可以分为两类：独立生成（Independent Drafting）和自生成（Self-drafting）

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。