Beam Search集束搜索

最新推荐文章于 2024-06-15 11:13:23 发布

CharlesOyfz

最新推荐文章于 2024-06-15 11:13:23 发布

阅读量1.3k

点赞数

分类专栏： nlp 深度学习自然语言处理(nlp) 文章标签： Seq2seq

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CharlesOyfz/article/details/90735404

版权

在Seq2Seq模型的解码过程中， Beam Search是一种常用的策略。它每次保留b个最高概率的选择，并在下一轮中扩展这些选择，直至序列结束。在机器翻译示例中，通过逐步扩展和选择最高概率的组合，最终得到多个可能的翻译结果。随着beam size增大，搜索空间扩大，计算复杂度增加，通常选择b=10左右作为平衡点。

摘要由CSDN通过智能技术生成

在Seq2Seq解码部分中,常用到Beam Search。每个时刻它会保存b（beam size）个概率最大的选择作为当前的最佳选择，然后解码下一时刻时，继续选择和之前保存的b个选择组合起来后的概率最大的b个选择，依次循环迭代下去，直到编码结束。

下面直接上图：

在机器翻译中:

法语输入:Jane visite l’Afrique en septembre.

人工翻译:Jane visits Africa in September.

这里 beam size 为3。

在时刻1时,模型选择了概率最大的三个选择为:in ,jane,september。

在时刻2时，模型分别对时刻1的三个单词组合每个组合做贪心搜索，然后输出条件概率最大的三个选择为：in september，jane is,jane visits.

在时刻3,模型继续对前面的三个组合每个组合做贪心搜索,然后输出条件概率最大的三个选择为:

in september Jane,jane is visit , jane visits africa.

依次循环直到最后输出<EOS>符. 假设最后输出为这三个答案:

1)Jane is visit Africa in September.<EOS>

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Beam Search集束搜索

在Seq2Seq解码部分中,常用到Beam Search。每个时刻它会保存b（beam size）个概率最大的选择作为当前的最佳选择，然后解码下一时刻时，继续选择和之前保存的b个选择组合起来后的概率最大的b个选择，依次循环迭代下去，直到编码结束。下面直接上图：在机器翻译中:法语输入:Jane visite l’Afrique en septembre.人工翻译:Jane vis...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。