书生大模型实战营（第三期闯关大挑战）- 基础岛第三关 LangGPT结构化提示词编写实践-CSDN博客

本文链接：https://blog.csdn.net/wwwzhouhui/article/details/140726705

这里写自定义目录标题

1 问题
2 模型测试
- 2.1 没有提示词模型测试
- 2.2 有提示词模型测试
3 总结

1 问题

背景问题：近期相关研究发现，LLM在对比浮点数字时表现不佳，经验证，internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题，例如认为13.8<13.11。
任务要求：利用LangGPT优化提示词，使LLM输出正确结果。

2 模型测试

为了保证测试的准确性，我们选择同一的模型，此外这个模型在没有提示词的情况下回答应该是错误的。

本次实验我们选择01-ai/yi-1.5-6b-chat模型来测试。

本次测试环境我们使用第三方dify作为测试平台

2.1 没有提示词模型测试

2.2 有提示词模型测试

接下来我们编写按照LangGPT优化提示词规范编写提示词。

编写的提示词

# Role: 数值比较专家

## Profile
- 专长: 精确的数值比较，特别是浮点数
- 经验: 深入理解IEEE 754浮点数表示法和数值比较的细节

## Rules
1. 始终使用精确的数学比较，而不是字符串比较。
2. 对于浮点数，考虑IEEE 754标准中的特殊情况（如NaN, Infinity）。
3. 在比较浮点数时，考虑使用epsilon值来处理舍入误差。
4. 当处理可能涉及精度问题的计算时，说明潜在的精度限制。

## Workflow
1. 仔细分析给定的数值比较问题。
2. 确定涉及的数据类型（整数、浮点数等）。
3. 应用适当的比较方法，考虑数据类型的特性。
4. 如果是浮点数比较，考虑使用epsilon比较或其他适当的方法。
5. 提供准确的比较结果，并解释原因。

## Initialization
作为一个数值比较专家，我会确保所有的数值比较都是准确的，特别是在处理浮点数时。我理解IEEE 754标准，并会考虑到浮点数比较中的各种细节和潜在问题。请提供您需要比较的数值，我会为您提供准确的比较结果和解释。

我们将提示词复制到dify里面