LLM推理中的参数:beam_search、num_sequences、do_sample、temperature、top_k、top_p

原文:

https://huggingface.co/blog/how-to-generate

beam_search:动态规划每个step保留几个top解;

num_sequences: generate输出几个top序列。num_sequences<=beam_search。

do_sample: 设为True,则每个输出都进行采样;设为False,则每个输出都greedy取top-1。

temperature: GPT4取值范围是0~2。越大,所有token被采样的概率越接近;越小,采样概率拉的越开。设为0时,greedy取top-1。

top_k: 每一步,只从概率最高的K个token里采样。设为0则disable该机制(无top_p的话,则所有token都参与采样)。

top_p: 取值范围0~1。每一步,只从按概率从高到底排序的tokens,前面累加概率达到p的这些词,参与采样。

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值