GreedySearch和BeamSearch解码方式

GreedySearch和BeamSearch解码方式 – 潘登同学的NLP笔记


重要一点: CTC Loss是在训练OCR的时求的Loss采用的,而以下这些算法都是推理时得到预测序列采用的

GreedySearch

GreedySearch则采取贪心算法来求解路径,就是将每个时刻t内最大的概率的状态取出,实例代码如下

在这里插入图片描述

便于理解,最终算法的结果如下

Beam Search(束搜索)

beam search是对greedy search的一个改进算法。相对greedy search扩大了搜索空间,但远远不及穷举搜索指数级的搜索空间,是二者的一个折中方案;

基本原理是通过 t i − 1 t_{i-1} ti1 b e a m S i z e beamSize beamSize个序列,每个序列分别连接 t i t_i ti V V V 个节点,得到 b e a m S i z e beamSize beamSize 个新序列及对应的 s c o r e score score,然后按照 s c o r e score score从大到小的顺序选出前 b e a m S i z e beamSize beamSize个序列,依次推进即可

在这里插入图片描述

注意算法中有以下一句,目的是为了防止underflow

logY = np.log(y)

最终得到的概率的形式是 p = y 1 ∗ y 2 ∗ ⋯ ∗ y n p=y_1*y_2*\cdots*y_n p=y1y2yn,会导致概率几乎为0,而最后对 s c o r e score score取一个exp即可
在这里插入图片描述

prefix beam search

代码基本脉络与beam search一致,最主要的一方面是基于如下的考虑:

有许多不同的路径在many-to-one map的过程中是相同的,但beam search却会将一部分舍去,这导致了很多有用的信息被舍弃了

举个例子

  • 有这样四条路径AAA_BAAAABAAB_BAB_BB,其分数分别为0.0030.0020.00350.004
  • 如果 b e a m S i z e beamSize beamSize为2,那么AAA_BAAAAB会被晒掉,开始AAA_BAAAAB最终去重之后得到的结果都是AB其实对应这个答案的概率应该是0.005(0.002+0.003),但是却不如后面两个…

在这里插入图片描述

在这里插入图片描述

其中logsumexp是用于解决数值计算下溢(underflow) 和上溢(overflow) 的问题,其实这里一开始我很不理解诶; 直接加不就行了嘛,概率相乘确实会下溢,但是不是已经取对数了嘛,但是结果又是对的,先放着,以后再说…(可能有用的logsumexp参考链接)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PD我是你的真爱粉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值