本文是LLM系列文章,针对《Efficient Non-Parametric Uncertainty Quantification for Black-Box Large
Language Models and Decision Planning》的翻译。
摘要
使用大型语言模型(LLM)的逐步决策规划在人工智能代理开发中越来越受到关注。本文主要研究具有不确定性估计的决策规划,以解决语言模型中的幻觉问题。现有的方法要么是白盒方法,要么是计算要求很高的方法,限制了在预算内使用黑盒专有LLM。该论文的第一个贡献是LLM的非参数不确定性量化方法,该方法在不使用标记logits的情况下,通过单一推理有效地估计动态输入决策之间的逐点依赖性。该估计器为决策可信度的统计解释提供信息。第二个贡献概述了决策代理的系统设计,根据“洗澡”等用户提示生成“打开浴室灯”等动作。当多个操作具有较高的点依赖性时,用户将被要求提供偏好。总之,我们的不确定性估计和决策代理设计为人工智能代理开发提供了一种成本效益高的方法。