一些模型测试中的BUG和可能解决方法

一些模型测试中的BUG和可能解决方法

模型一直重复反馈相同内容的问题查找思路

如下顺序也是排查优先级

  1. 检查提示词和上下文,保证提示词中没有类似的要求,然后再查看上下文是不是占满了token长度。
  2. 检查一下选择的model是不是本身就有这样的问题
  3. 尝试增加repeat_penalty(1.05、1.1,最大1.15或者1.2),看看是否会出现不自然的反馈。
  4. 利用frequency_penalty(0.1-0.5)减少重复使用的tokens,或者使用presence_penalty(0.1-0.5)减少上线文的重复tokens。
  5. 稍微增长一点min_p(例如增长到0.1),或者增长top_p到0.85,过滤掉一些由于低概率的tokens导致的循环。
  6. 如果temperature设置的比较高,可以尝试降低一点(例如降到0.7、0.8)

模型输出太随机相关性差

如下顺序也是排查优先级

  1. 增加temperature
  2. 降低min_p到0.05,或者更低的0.03
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CrissChan

开心就好

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值