微软首席科学官最新发布：提示工程的力量-The Power of Prompting

最新推荐文章于 2024-10-04 22:36:54 发布

叶锦鲤

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量1.2k

点赞数 16

文章标签：人工智能

本文链接：https://blog.csdn.net/YeJuliaLi/article/details/134724864

版权

微软首席科学官分享了关于GPT-4模型的研究，表明通用模型通过提示策略可以在医疗挑战问题上表现出专家水平，无需特殊微调。Medprompt方法的提出，使GPT-4在多个医疗基准上达到高性能，甚至超越了专门微调的模型。

摘要由CSDN通过智能技术生成

By Eric Horvitz（埃里克·霍尔维茨），首席科学官

Brain 翻译

今天，我们发表了一篇关于探索提示策略力的文章，展示了通用GPT-4模型如何在医疗挑战问题基准上发挥专家作用。该研究表明，在相同的基准上，GPT-4的性能明显优于专门针对医疗应用进行微调的领先模型。最近的其他研究也表明，仅靠提示策略就能有效地从通用基础模型中唤起特定领域的专业知识。

图1：Medprompt 各组成部分及对MedQA基准性能贡献的可视化说明。提示策略结合了基于kNN的少量示例选择、GPT-4生成的思维链提示和答案选择的随机集成。

在对GPT-4的能力进行早期评估时，我们欣喜地发现，GPT-4具备通用的解决问题能力，在抽象、概括和组合方面具有令人惊讶的多学科抽象能力，包括将跨学科的概念编织起来的能力。除了这些一般推理能力之外，我们还发现，GPT-4可以通过提示引导，成为众多领域的特定专家。在此之前，要激发这些能力，需要使用专门设计的数据对语言模型进行微调，以便在特定领域获得最佳性能。这提出了一个问题：对通用基础模型进行更广泛的训练可否减少微调需求。

在三月分享的一项研究中，我们展示了非常简单的提示策略如何揭示GPT-4在医学知识方面的优势，而无需进行特殊的微调。结果表明，“开箱即用”的模型如何通过基本的提示来应对一系列医学挑战问题。在我们最近的研究中，我们展示了如何将多种提示策略组合成一种我们称之为“Medprompt”的方法，从而有效地引导GPT-4达到最佳性能。特别是，我们发现使用Medprompt的 GPT-4：