大语言模型：Black-Box Prompt Optimization: Aligning Large Language Models without Model Training

CUHK-SZ-relu

已于 2024-03-14 16:19:59 修改

阅读量282

点赞数 2

文章标签： prompt 语言模型人工智能

于 2024-03-11 21:31:22 首次发布

本文链接：https://blog.csdn.net/qq_43210957/article/details/136635750

版权

研究的动机

大模型取得了很好的效果，但是如何削减人类的描述和大模型的理解偏差（gap）成为一个新的研究重点；
虽然前人的研究主要集中在重新训练模型完成这个任务，但是重新训练模型存在效率和开源模型少以及可解释性不足的问题；
因此本文作者提出了BPO（ Black-box Prompt Optimization）一种黑盒的prompt优化，作者主要区分了自己的方案的APE（automatic-prompt-engineers），他这里提出的方案在于可以自动完成优化，是一个an automatic prompt optimizer
并且超过了现有的一些方法和基线。

这里对为什么和训练LLM模型本文做对比以及为什么和APE不一样其实是一个隐藏问题

在这里插入图片描述
其实这个方法主要是分为几个步骤：

这里就可以明显的看出来作者为什么要和微调模型的基线做对比了，他也是训练了一个seq2seq的模型来增强prompt，也训练了，所以要和训练的基线作对比，以及确实和APE不一样。

展示了（demonstrated）：

关注