-
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为
13.8<13.11
。 -
任务要求:利用LangGPT优化提示词,使LLM输出正确结果。完成一次并提交截图即可
安装依赖
部署模型
运行webdemo
测试
模型拒绝回答
添加系统提示词
模型正确回答
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11
。
任务要求:利用LangGPT优化提示词,使LLM输出正确结果。完成一次并提交截图即可
安装依赖
部署模型
运行webdemo
测试
模型拒绝回答
添加系统提示词
模型正确回答