20200217-20200223阅读论文笔记

最新推荐文章于 2024-04-17 19:38:23 发布

Xiao_yanling

最新推荐文章于 2024-04-17 19:38:23 发布

阅读量1k

点赞数

分类专栏：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xiao_yanling/article/details/104455464

版权

本文笔记探讨了在文本生成任务中，自回归与非自回归模型之间的训练目标（log-likelihood）与评估指标（Bleu）的相关性。在相同类型模型中两者相关性强，不同类型则不明显。此外，自我训练在提高生成任务性能方面发挥作用，论文通过噪声和解码策略实验揭示其原因。最后，针对似然性训练导致的文本退化问题，提出了Nucleus Sampling和unlikelihood training等解冑策略。

摘要由CSDN通过智能技术生成

On the Discrepancy between Density Estimation and Sequence Generation

问题：探究训练目标（log-likelihood）和实际文本生成评价指标（Bleu）之间的相关性关系。

背景知识总结：

Autoregressive Model：逐词翻译—>exposure bias
Non-autoregressive Model：一次翻译整个句子---->引入隐变量

论文方法：
基于多个数据集实现以下模型：
（1）自回归：Transformer（S,B,L)
(2)非自回归：隐变量先验为diagonal gaussian和Normalizing Flow

实验结果及结论与思考：
在这里插入图片描述
（1）同一类型的模型进行比较时， ll的训练目标和bleu的评价指标相关性很强。（显然的？）
（2）不同类型的模型之间进行比较时，没有什么相关性。（在非自回归效果一般差于自回归的情况下，关于这点结论不太清楚想要说明什么，邹博的看法是要看ll是不是因地制宜？但这个结论可以看出来非自回归模型在受除训练目标的其他因素影响而效果比自回归模型差ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
20200217-20200223阅读论文笔记

On the Discrepancy between Density Estimation and Sequence Generation问题：探究训练目标（log-likelihood）和实际文本生成评价指标（Bleu）之间的相关性关系。背景知识总结：资料：https://www.leiphone.com/news/201911/FQ1HdiHYBcr5EX7z.htmlAutoregr...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。