深度学习-beam search

fj1024

已于 2024-07-01 20:42:15 修改

阅读量199

点赞数 1

文章标签：深度学习人工智能

于 2024-06-28 15:31:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fj1024/article/details/140043591

版权

束搜索指在每一个时间步解码时，不再只保留一个分数最高的作为输出，保留num_beams个。当num_beams=1时，束搜索就退化成了贪心搜索。

缺点，虽然比贪心搜索强不少，但是也会生成出重复、空洞、前后矛盾的文本。

改进方法：

随机采样，用随机采样(sampling)代替取概率最大的词。增大所选词的范围，引入更多的随机性。

temperature随机采样，用过温度参数控制softmax函数产生单词概率的平滑程度。

通过调整温度参数 T 的值，可以改变输出向量 y中每个元素的相对大小。当温度参数 T 较高时，指数运算的结果会变得更加平均，导致概率分布更加均匀，各个类别的概率差异较小。而当温度参数 T 较低时，指数运算的结果会更加集中，导致概率分布更加尖锐，各个类别的概率差异较大。

当温度参数 T趋近于无穷大时，softmax函数的输出将趋近于均匀分布，即每个类别的概率接近于 1\n，其中 n是类别的数量。而当温度参数T趋近于零时，softmax函数的输出将趋近于一个独热编码，即只有最大值对应的类别的概率接近于1，其他类别的概率接近于0。

top k 采样这个方法就是在采样前将输出的概率分布截断，取出概率最大的k个词构成一个集合，然后将这个子集词的概率再归一化，最后从新的概率分布中采样词汇。

top p 采样累加概率，前若干个词多概率进行累加一直到达到p的阈值，然后取出前面这若干个词，重新进行概率归一化，并把剩下词的概率设为0。

惩罚重复：为了解决重复问题，还可以通过惩罚因子将出现过词的概率变小或者强制不使用重复词来解决。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习-beam search

通过调整温度参数 T 的值，可以改变输出向量 y中每个元素的相对大小。而当温度参数T趋近于零时，softmax函数的输出将趋近于一个独热编码，即只有最大值对应的类别的概率接近于1，其他类别的概率接近于0。top k 采样这个方法就是在采样前将输出的概率分布截断，取出概率最大的k个词构成一个集合，然后将这个子集词的概率再归一化，最后从新的概率分布中采样词汇。top p 采样累加概率，前若干个词多概率进行累加一直到达到p的阈值，然后取出前面这若干个词，重新进行概率归一化，并把剩下词的概率设为0。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。