Beam Search集束搜索

在Seq2Seq模型的解码过程中, Beam Search是一种常用的策略。它每次保留b个最高概率的选择,并在下一轮中扩展这些选择,直至序列结束。在机器翻译示例中,通过逐步扩展和选择最高概率的组合,最终得到多个可能的翻译结果。随着beam size增大,搜索空间扩大,计算复杂度增加,通常选择b=10左右作为平衡点。
摘要由CSDN通过智能技术生成

在Seq2Seq解码部分中,常用到Beam Search。每个时刻它会保存b(beam size)个概率最大的选择作为当前的最佳选择,然后解码下一时刻时,继续选择和之前保存的b个选择组合起来后的概率最大的b个选择,依次循环迭代下去,直到编码结束。

下面直接上图:

在机器翻译中:

法语输入:Jane visite l’Afrique en septembre.

人工翻译:Jane visits Africa in September.

这里 beam size 为3。

在时刻1时,模型选择了概率最大的三个选择为:in ,jane,september。

在时刻2时,模型分别对时刻1的三个单词组合每个组合做贪心搜索,然后输出条件概率最大的三个选择为:in september,jane is,jane visits. 

在时刻3,模型继续对前面的三个组合每个组合做贪心搜索,然后输出条件概率最大的三个选择为:

in september Jane,jane is visit , jane visits africa.

依次循环直到最后输出<EOS>符. 假设最后输出为这三个答案:

1)Jane is visit Africa in September.<EOS>

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值