GreedySearch和BeamSearch解码方式

最新推荐文章于 2024-04-29 08:49:12 发布

PD我是你的真爱粉

最新推荐文章于 2024-04-29 08:49:12 发布

阅读量674

点赞数 1

分类专栏： Tensorflow 文章标签：机器学习深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52185313/article/details/124804473

版权

Tensorflow 专栏收录该内容

41 篇文章 9 订阅

订阅专栏

GreedySearch和BeamSearch解码方式 – 潘登同学的NLP笔记

文章目录

- GreedySearch和BeamSearch解码方式 -- 潘登同学的NLP笔记
GreedySearch
Beam Search（束搜索）
prefix beam search

重要一点： CTC Loss是在训练OCR的时求的Loss采用的，而以下这些算法都是推理时得到预测序列采用的

GreedySearch

GreedySearch则采取贪心算法来求解路径，就是将每个时刻t内最大的概率的状态取出，实例代码如下

在这里插入图片描述

便于理解，最终算法的结果如下

Beam Search（束搜索）

beam search是对greedy search的一个改进算法。相对greedy search扩大了搜索空间，但远远不及穷举搜索指数级的搜索空间，是二者的一个折中方案;

基本原理是通过 $t_{i-1}$ 中 $b e a m S i z e$ 个序列，每个序列分别连接 $t_i$ 中 $V$ 个节点，得到 $b e a m S i z e$ 个新序列及对应的 $s c o r e$ ，然后按照 $s c o r e$ 从大到小的顺序选出前 $b e a m S i z e$ 个序列，依次推进即可

在这里插入图片描述

注意算法中有以下一句,目的是为了防止underflow

logY = np.log(y)

最终得到的概率的形式是 $p=y_1*y_2*\cdots*y_n$ ,会导致概率几乎为0,而最后对 $s c o r e$ 取一个exp即可
在这里插入图片描述

prefix beam search

代码基本脉络与beam search一致，最主要的一方面是基于如下的考虑：

有许多不同的路径在many-to-one map的过程中是相同的，但beam search却会将一部分舍去，这导致了很多有用的信息被舍弃了

举个例子

有这样四条路径AAA_B、AAAAB、AAB_B、AB_BB，其分数分别为0.003、0.002、0.0035、 0.004
如果 $b e a m S i z e$ 为2,那么AAA_B、AAAAB会被晒掉，开始AAA_B、AAAAB最终去重之后得到的结果都是AB其实对应这个答案的概率应该是0.005（0.002+0.003）,但是却不如后面两个…

在这里插入图片描述

在这里插入图片描述

其中logsumexp是用于解决数值计算下溢(underflow) 和上溢(overflow) 的问题，其实这里一开始我很不理解诶；直接加不就行了嘛，概率相乘确实会下溢，但是不是已经取对数了嘛，但是结果又是对的，先放着，以后再说…(可能有用的logsumexp参考链接)

PD我是你的真爱粉

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
GreedySearch和BeamSearch解码方式

GreedySearch和BeamSearch解码方式 – 潘登同学的NLP笔记文章目录GreedySearch和BeamSearch解码方式 -- 潘登同学的NLP笔记GreedySearchBeam Search（束搜索）prefix beam search重要一点： CTC Loss是在训练OCR的时求的Loss采用的，而以下这些算法都是推理时得到预测序列采用的GreedySearchGreedySearch则采取贪心算法来求解路径，就是将每个时刻t内最大的概率的状态取出，实例代码如下便于
复制链接

扫一扫

专栏目录

PD我是你的真爱粉 CSDN认证博客专家 CSDN认证企业博客

码龄4年

东北财经大学

179: 原创

4万+: 周排名

8万+: 总排名

30万+: 访问

: 等级

2215: 积分

281: 粉丝

252: 获赞

158: 评论

1766: 收藏

私信

关注

热门文章

分类专栏

计量经济学 53篇
概率论与数理统计 13篇
Tensorflow 41篇
机器学习 24篇
pytorch 1篇
Linux 5篇
笔记 10篇
图论 11篇
Django框架 2篇
Tornado框架 4篇
Flask框架 8篇
前端 3篇

最新评论

将pyx文件编译成pyd文件(很多坑，已解决)
m0_69196446: 请问是什么其他问题，能分享一下经验吗
【计量经济学】固定效应、随机效应、相关随机效应
PD我是你的真爱粉: 这是伍德里奇的计量经济学导论
【计量经济学】固定效应、随机效应、相关随机效应
daboluo112233: 请问这是哪一本教材上的？
tushare实战LSTM实现黄金价格预测
weixin_39127006: 请教，这个代码是在python环境下跑吗？我用jupyter运行会报错。--------------------------------------------------------------------------- ModuleNotFoundError Traceback (most recent call last) Cell In[4], line 10 8 dense_layers = [2] 9 units = [64] ---> 10 from tensorflow.keras.callbacks import ModelCheckpoint 11 for the_mem_days in mem_days: 12 for the_lstm_layers in lstm_layers: ModuleNotFoundError: No module named 'tensorflow'
使用DeepAR实现股价预测
PD我是你的真爱粉: 无论是从机器学习还是计量经济学的原理上来看，都没有要求时间序列数据服从正态分布，但是一般会要求误差u服从整体分布，不然估计出的系数不准确，但是从预测角度来讲完全没关系

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

PD我是你的真爱粉 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。