集束搜索（beam search）和贪心搜索（greedy search）

最新推荐文章于 2025-02-07 18:57:04 发布

小小鸟要高飞

最新推荐文章于 2025-02-07 18:57:04 发布

阅读量1.2w

点赞数 9

分类专栏：自然语言处理文章标签： NLP 自然语言处理搜索算法集束搜索贪心搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38937984/article/details/102492050

版权

自然语言处理专栏收录该内容

45 篇文章

订阅专栏

本文深入浅出地介绍了集束搜索和贪心搜索两种算法，详细解释了它们的工作原理和应用场景，通过实例展示了如何利用这两种算法进行序列生成。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近读论文的时候看到文中经常用到集束搜索（beam search），可能很多人不懂这到底是个什么算法，其实很简单，顺便把贪心搜索（greedy search）也介绍一下。

贪心搜索(greedy search)

贪心搜索最为简单，直接选择每个输出的最大概率，直到出现终结符或最大句子长度。

在这里插入图片描述

集束搜索(beam search)

集束搜索是一种启发式图搜索算法，在图的解空间比较大的情况下，为了减少搜索所占用的空间和时间，在每一步深度扩展的时候，剪掉一些质量比较差的结点，保留下一些质量较高的结点。

具体过程为：使用广度优先策略在树的每一层建立搜索树，按照启发代价对节点进行排序，然后仅留下预先确定的个数（Beam Width-集束宽度）的节点，仅这些节点在下一层次继续扩展，其他节点就被剪掉了。（注意：如果集束宽度无穷大，那该搜索就是宽度优先搜索）

好处：减少了空间消耗，并提高了时间效率。

概念可能不好理解，下完下面的例子你就会发觉真的很简单。

假设字典为[a,b,c]，beam size选择2，则如下图有：

在生成第1个词的时候，选择概率最大的2个词，那么当前序列就是a或b。
生成第2个词的时候，我们将当前序列a或b，分别与字典中的所有词进行组合，得到新的6个序列aa ab ac ba bb bc,然后从其中选择2个概率最高的，作为当前序列，即ab或bb。
不断重复这个过程，直到遇到结束符为止。最终输出2个概率最高的序列。

在这里插入图片描述

是不是很简单啊？

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。