2020-11-17

最新推荐文章于 2023-06-30 17:09:52 发布

MarDino

最新推荐文章于 2023-06-30 17:09:52 发布

阅读量194

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44106928/article/details/109735498

版权

深度学习专栏收录该内容

24 篇文章 3 订阅

订阅专栏

Beam Search

beam search 束搜索是基于穷举搜索和贪心搜索的折中搜索方案

穷举搜索

假设我有 A B C 三个词需要解码
我们可以穷尽所有排列组合，一共是27种，因为3个时间步，每个时间步都有3个选择，组合有：

AAA AAB AAC ABA ACA 。。。。

这种搜索带来的问题在于时间复杂度过大

贪心搜索

贪心搜索仅考虑当前状态下最优的组合
在这里插入图片描述
我们先看T1时间步，发现是A概率最高。
于是我们以A为基础继续看T2时间步，组合有: AA, AB, AC，然后发现是与B组合概率高，因此以AB作为基础
我们最后看第三时间步，组合有：ABA, ABB, ABC，可以观察到 ABB的概率是最高的，因此我们对应的结果就是 ABB

注意这个并不意味着ABB是全局最优的组合。

束搜索

穷举搜索过于复杂，贪心搜索只考虑当前情况，而做不到全局最优。因此我们提出了束搜索。
首先我们定义一个概念，束宽：beam_size
束宽代表每个时间步下，我们束搜索关注概率为前beam_size个最大的词

因此贪心搜索是束搜索的一个特例，即beam_size = 1

下面我们还是以ABC的示例，看看beam_size = 2的情形
时间步T1，我们选出概率最大的两个词，即A和B
在这里插入图片描述
时间步T2，我们就需要考虑两种情况：

时间步T1为 A
时间步T2为 B

每个时间步有3个组合，因此2x3就是6种组合
在这里插入图片描述
可以看到这里我们有六种组合，我们选择前2个最大的，即AC和BA，进入到下一轮的束搜索

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020-11-17

Beam Searchbeam search 束搜索是基于穷举搜索和贪心搜索的折中搜索方案穷举搜索假设我有 A B C 三个词需要解码我们可以穷尽所有排列组合，一共是27种，因为3个时间步，每个时间步都有3个选择，组合有：AAA AAB AAC ABA ACA 。。。。这种搜索带来的问题在于时间复杂度过大贪心搜索贪心搜索仅考虑当前状态下最优的组合我们先看T1时间步，发现是A概率最高。于是我们以A为基础继续看T2时间步，组合有: AA, AB, AC，然后发现是与B组合概率高，因此以A
复制链接

扫一扫

专栏目录

MarDino CSDN认证博客专家 CSDN认证企业博客

码龄6年

114: 原创

23万+: 周排名

223万+: 总排名

28万+: 访问

: 等级

3472: 积分

129: 粉丝

288: 获赞

122: 评论

1118: 收藏

私信

关注

热门文章

分类专栏

MXNET 7篇
深度学习 24篇
飞桨框架 4篇
LeetCode 27篇
数据结构 16篇
面试 23篇
Pytorch 4篇
开发 1篇
C++ 6篇
Keras 4篇
Opencv 1篇
安全 5篇
Python 37篇
爬虫 8篇
机器学习 22篇

最新评论

小米手机安装charles证书
洋_奕: 我是通过微信将证书发到手机的，和数据线传输有问题吗？我的app抓不到
1X1卷积核的理解
犬薇: 不理解，看不明白，为啥就升维或者降维了
Vision transformer
二月剪刀: 有一个问题self.pos_embedding = nn.Parameter(torch.randn(1, num_patches + 1, dim))，那么把position_embedding加入到输入x里面论文中说是直接相加嘛，那为什么x += self.pos_embedding[:, :(n + 1)]这个地方要取列的索引，取前n+1列这个索引一直没懂，我的理解是不应该加全部吗，拼接完cls_token后x的shape是（b,n+1,d）嘛（b即batch，n即patch数，d即flatten后的维度），这里pos_embedding的shape是（n+1,d)，那么直接广播相加就行了啊，为什么还要取一个列的n+1索引一直没想明白
小米手机安装charles证书
qq_43158931: 求助，redmi note 11型号，miui14.0.2系统版本安装抓包怎么整
卷积神经网络的可视化——热力图Grad CAM
weixin_62025716: 如何换成自己的模型呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。