-
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为
13.8<13.11
。 -
任务要求:利用LangGPT优化提示词,使LLM输出正确结果。完成一次并提交截图即可
安装webui依赖
修改提示词前
streamlit run chat_ui.py
运行webui
打开浏览器输入127.0.0.1
开始测试
可以看到模型回答不佳
修改系统提示词
模型正确回答问题