文本生成中的采样策略

用于测试deocder解码阶段

怎么拓展句子的多样性

通过概率分布来选择每一步生成的单词,会使得系统为了达到生成结果的概率最大,就会产生很多通用一致的回复。

1.贪心搜索

每个时间步都选择分布中概率最大的作为当前解码的单词,问题在于,容易生成很多重复的句子。

2.beam search

在每个时间步保留topK的结果,最后选择一个概率最大的结果。

2.1beam search的优化

Length Normlization:在语言模型中,随着句子的越来越长,极大似然的累乘会变得越来越小。
Coverage Normalization:如果attention学习的不好,就会让模型只过多的关注某些词,然后导致重复翻译的现象,通过Coverage惩罚可以让decoder均匀的关注x中的词,防止一些token获得过多的注意力。
设置decoder最大输出长度限制

3.topK采样

4.随机采样

怎么停止解码

在测试解码的时候,不需要限定解码的长度,等模型预测出EOS这个token,解码就停止了。

文本生成领域其他的一些trick

输入不仅包括token还包括一些句子,然后query不变,key,value增加了了那些句子。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

石头猿rock

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值