image caption笔记（十）：一些实现过程中的小细节

最新推荐文章于 2024-05-13 10:48:35 发布

月半rai

最新推荐文章于 2024-05-13 10:48:35 发布

阅读量1.1k

点赞数 1

分类专栏： image caption

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zlrai5895/article/details/90042502

版权

image caption 专栏收录该内容

20 篇文章 6 订阅

订阅专栏

1、beam search 一方面可以提升指标，另一方面也可以解决生成的句子不通顺的问题。因此，不管是在训练测试的过程中都要开beamsearch ，对提高指标有帮助。还有就是，如果训练的时候 beam size设置为1，而只是在测试的时候使用beamsearch，原本好的模型可能会变得还不如原本差的模型。也就是，beam size=1下的好的模型到了beam size=5下未必还能继续好。
2、交叉熵训练的过程中开 scheduled_sample 解决一次预测错后面全部预测错的问题（exposure bias）。强化学习（比如CIDER引导优化）目的在于（1）解决exposure bias问题（2）训练目标和评价指标的不一致但是在强化学习训练的时候，仍然要开 scheduled_sample ，因为对提升指标会有帮助。
3、RL加beam search训练的模型只比RL加greedy decoding训练的模型有少量的提升（但是消耗时间）
（待续）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
image caption笔记（十）：一些实现过程中的小细节

1、beam search 一方面可以提升指标，另一方面也可以解决生成的句子不通顺的问题。因此，不管是在训练测试的过程中都要开beamsearch ，对提高指标有帮助。还有就是，如果训练的时候 beam size设置为1，而只是在测试的时候使用beamsearch，原本好的模型可能会变得还不如原本差的模型。也就是，beam size=1下的好的模型到了beam size=5下未必还能继续好。2...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。