解码策略（搜索）

最新推荐文章于 2024-04-06 09:54:37 发布

趋吉避凶

最新推荐文章于 2024-04-06 09:54:37 发布

阅读量445

点赞数 1

文章标签： 1024程序员节贪心算法算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/black_lightning/article/details/120931343

版权

文章目录

beam search（集束搜索）
Exhausitive Search（暴力搜索）
greedy search（贪心搜索）
总结

beam search（集束搜索）

而beam search是对贪心策略一个改进。思路也很简单，就是稍微放宽一些考察的范围。在每一个时间步，不再只保留当前分数最高的1个输出，而是保留num_beams个。当num_beams=1时集束搜索就退化成了贪心搜索。
在这里插入图片描述

优点：综合了Greedy search和Exhausitive Search，在他们中间取取平衡，beam size为1即为greddy search，beam size为N(词库大小)即为Exhausitive Search。缺点：无。

Exhausitive Search（暴力搜索）

暴力搜索考虑的是全局最优解，需要把每一种可能输出结果都算出来，然后找出概率最大的输出。这种搜索空间是非常巨大的，假设我们的词表大小为N，句子长度为T个单词，整个搜索时间复杂度为O(NNT)，一般N取值在几万到几十万级别，T在为几百个单词，实际计算比较慢。

优点：全局最优解，缺点：计算速度慢。

greedy search（贪心搜索）

greedy search比较简单，就是贪婪式的搜索，每一步都选择概率最大的单词输出，最后组成整个句子输出。这种方法给出的结果一般情况结果比较差，因为只考虑了每一步的最优解，往往里全局最优解差距很大。假设我们的词表大小为N，句子长度为T个单词，整个搜索时间复杂度为O(1NT)。
例如下图，每一个时间步都取出了条件概率最大一个结果，生成了序列[A,B,C]。

在这里插入图片描述

很明显，这样做将原来指数级别的求解空间直接压缩到了与长度线性相关的大小。由于丢弃了绝大多数的可能解，这种关注当下的策略无法保证最终得到的序列概率是最优的。

总结

工作随笔，希望可以帮助到大家！
如有不足之处，请多多指教！

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
解码策略（搜索）

文章目录beam search（集束搜索）Exhausitive Search（暴力搜索）greedy search（贪心搜索）总结beam search（集束搜索）而beam search是对贪心策略一个改进。思路也很简单，就是稍微放宽一些考察的范围。在每一个时间步，不再只保留当前分数最高的1个输出，而是保留num_beams个。当num_beams=1时集束搜索就退化成了贪心搜索。优点：综合了Greedy search和Exhausitive Search，在他们中间取取平衡，beam si.
复制链接

扫一扫

趋吉避凶 CSDN认证博客专家 CSDN认证企业博客

码龄5年

21: 原创

1万+: 周排名

6万+: 总排名

4万+: 访问

: 等级

584: 积分

3677: 粉丝

131: 获赞

84: 评论

314: 收藏

私信

关注

热门文章

分类专栏

LLM 2篇
NLP 4篇
Docker 1篇
机器学习 1篇
python库 4篇
排序算法 2篇
Neo4j 4篇
Linux 1篇
msyql 2篇

最新评论

LLM微调系列——Qwen微调教程
小振子: 请问微调后几乎只能回答微调数据中的问答，丢失了原有的问答能力，怀疑是模型合并时有问题，请问博主有遇到过这种情况吗？
Python创建知识图谱
趋吉避凶: 把你json中的数字转为string或者用int（）转一下
Python创建知识图谱
m0_71373749: TypeError: Neo4j does not support JSON parameters of type int64我也是这个问题，想问一下怎么解决啊
Python创建知识图谱
m0_71373749: 求完整代码
Albert处理文本分类任务
兔兔奈229: 博主完整代码可分享嘛 [email protected]

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

趋吉避凶 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。