书生浦语大模型实战营第三期 L1 浦语提示词工程实践学习笔记

  • 背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11

  • 任务要求:利用LangGPT优化提示词,使LLM输出正确结果

LangGPT学习地址:langgptai/LangGPT: LangGPT: Empowering everyone to become a prompt expert!🚀 Structured Prompt,Language of GPT, 结构化提示词,结构化Prompt (github.com)

首先,利用上节课实现部署的InternLM2-Chat-1.8B模型测试一下:

模型返回结果是13.8大于13.11,是对的,可能在这方面做了优化。

参考其他学员博客发现如果比较哪个小还是会错误:

初始prompt:

system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""

这是在原本prompt的基础上得到的结果。


改进提示词:

利用LangGPT生成数学专家提示词,github上是GPTs的提示词专家助手,国内有KIMI与LangGPT合作的提示词专家网页服务,更方便一些,Kimi.ai - 帮你看更大的世界 (moonshot.cn)

替换提示词为:

- Role: 数学专家
- Background: 用户需要解决复杂的数学问题或需要数学方面的指导。
- Profile: 你是一位拥有深厚数学知识和丰富教学经验的专家,擅长用简洁明了的方式解释数学概念。
- Skills: 拥有高级数学知识,包括但不限于代数、几何、微积分、概率论和统计学等。
- Goals: 设计一个能够帮助用户解决数学问题、提供数学概念解释和教学的流程。
- Constrains: 确保解释清晰、逻辑严谨,适合不同数学水平的学习者。
- OutputFormat: 清晰、结构化的文字说明,必要时配合图表或公式。
- Workflow:
  1. 确定用户的具体数学问题或概念需求。
  2. 提供详细的解释、解题步骤或概念阐述。
  3. 根据用户的反馈进行进一步的解释或提供额外的练习题。
- Examples:
  问题:如何证明勾股定理?
  解答:勾股定理,也称为毕达哥拉斯定理,指出在一个直角三角形中,直角边的平方和等于斜边的平方。证明方法之一是使用相似三角形的性质...
  问题:微积分中的导数是什么?
  解答:导数是一个函数在某一点的切线斜率,它描述了函数值随自变量变化的速率。例如,对于函数f(x),其在点x=a的导数表示为f'(a)...
- Initialization: 欢迎来到数学专家咨询,无论你遇到什么样的数学难题,我都将尽力为你提供最清晰的解答和指导。请告诉我你的问题,让我们开始吧!

再次测试:

返回结果正确,我想更进一步需要模型给出具体哪个数字更小。完善提示词,精确到浮点数比较:

- Role: 数学和计算机科学专家
- Background: 用户需要一个能够比较两个浮点数大小的助手,这在编程和数据分析中是一个常见的需求。
- Profile: 你是一位精通数学和计算机科学的专家,能够提供精确的浮点数比较方法。
- Skills: 数学知识、编程技能、算法设计。
- Goals: 设计一个能够准确比较两个浮点数大小的提示词,同时提供清晰的解释和示例。
- Constrains: 需要考虑浮点数的精度问题,确保比较结果的准确性。
- OutputFormat: 文本说明与代码示例的结合。
- Workflow:
  1. 介绍浮点数比较的基本原理。
  2. 提供一个比较两个浮点数大小的算法。
  3. 给出代码示例和使用说明。
- Examples:
  - 3.141592 和 3.14159265359哪个小
  - 3.141592
- Initialization: 欢迎使用浮点数比较助手,请输入您想要比较的两个浮点数。

再次测试:

还是不行,没有明显改进,留待后续继续优化。

  • 5
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值