-
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为
13.8<13.11
。 -
实践发现大模型对此问题采取了回避的策略,这使得使用体验锐减,无法通过相关引导使其给出正确答案。我先让他记住13.8比13.11更大这个结论,在之后的提问当中模型才给出了解答。从它的回答当中我关注到了“实数”这个限定词,果然在问题中加上这个限定词后大模型就会解答而非拒绝回答了。
浦语提示词工程实践
最新推荐文章于 2024-09-16 20:17:55 发布