告别提示词工程, 斯坦福重新定义LLM开发范式，DSPy框架已获18.4K Star！-CSDN博客

本文链接：https://blog.csdn.net/m0_59164520/article/details/143606449

DSPy:告别提示词工程,拥抱编程式LLM开发

斯坦福大学NLP小组开源了一个名为DSPy的star数高达18.4k的LLM开发框架,它提出了一种全新的方式来构建基于大语言模型的应用 - 不是通过手工编写和优化提示词(Prompt),而是通过编程的方式来声明和组合模块。本文带你一探这个创新框架的特点和优势。

为什么需要DSPy?

在当前的LLM应用开发中,我们主要依赖于手工编写和优化提示词模板。这种方式存在以下问题:

1. 提示词往往冗长且脆弱,需要反复调试

2. 针对特定场景优化的提示词难以迁移到其他场景

3. 整个过程较为艺术化,缺乏系统性

4. 难以构建和维护复杂的LLM应用流程

DSPy框架正是为了解决这些问题而生。它让开发者可以用更加结构化、模块化的方式来开发LLM应用。

DSPy的核心理念

DSPy的核心理念是将LLM应用开发转变为编程式的范式,主要包含三个关键抽象:

1. Signatures(签名): 声明式地定义输入输出行为

2. Modules(模块): 封装常用的提示词模式,支持组合构建pipeline

3. Teleprompters(优化器): 自动优化生成的提示词

让我们逐一来看这些概念。

Signatures: 声明式定义任务

在DSPy中,我们使用Signature来声明任务的输入输出行为。看看下面这行代码：

sig = dspy.Signature("question -> answer")

没错，就这么简单！这行代码优雅地完成了原本需要手写几百字提示词的工作。如此简洁的声明式语法，不得不让人感叹DSPy设计的精妙！

当然，我们还可以用类定义的方式来实现更细粒度的控制：

class BasicQA(dspy.Signature):       """回答问题的简单问答模块"""       question = dspy.InputField()       answer = dspy.OutputField(desc="brief answer")

这两种方式都比手写长篇的提示词要简洁得多,而且更容易维护和修改。

Modules: 模块化构建应用

DSPy提供了多个内置模块,覆盖了常见的提示词技术:

ChainOfThought: 思维链推理
ProgramOfThought: 编程式思维
Retriever: 检索增强生成
ReAct: 推理和行动交互

我们可以组合这些模块构建复杂的应用。例如一个简单的RAG系统:

class RAG(dspy.Module):       def __init__(self, num_passages=3):           super().__init__()           self.retrieve = dspy.Retrieve(k=num_passages)           self.generate = dspy.ChainOfThought(RAGSignature)                  def forward(self, question):           context = self.retrieve(question).passages           return self.generate(context=context, question=question)

Teleprompters: 自动优化提示词

DSPy的一大亮点是提供了优化器来自动优化生成的提示词。我们只需要:

1. 提供一些训练样例

2. 定义评估指标

3. 使用优化器编译模块

例如:

# 定义评估指标   def evaluate(example, pred):       return pred in ["positive", "negative", "neutral"]      # 创建优化器   optimizer = dspy.BootstrapFewShot(       metric=evaluate,       trainset=examples   )      # 编译优化   compiled_model = optimizer.compile(MyModule())

DSPy vs 传统方法的优势

相比传统的提示词工程,DSPy具有以下优势:

更高的可维护性: 代码更加结构化,易于理解和修改
更好的复用性: 模块可以方便地在不同项目间复用
自动优化: 优化器可以自动改进提示词效果
更强的扩展性: 易于构建复杂的应用流程

实践建议

1. 从简单的Signature开始,逐步熟悉DSPy的编程模式

2. 充分利用内置模块,避免重复造轮子

3. 善用优化器提升效果

4. 注意保持代码的模块化和可维护性

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述