一、关卡任务
-
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为
13.8<13.11
。 -
任务要求:利用LangGPT优化提示词,使LLM输出正确结果。完成一次并提交截图即可
二、实验过程
2.1 创建基础环境
lmdeploy serve api_server /root/model/internlm2-chat-1_8b --server-port 7860
服务成功启动:
2.2 测试案例
问题:13.8和13.11哪个更大?
结果: