API Is Enough: Conformal Prediction for Large Language Models Without Logit-Access

本文是LLM系列文章,针对《API Is Enough: Conformal Prediction for Large Language Models Without Logit-Access》的翻译。

API足够了:没有Logit-Access的大型语言模型的共形预测

摘要

这项研究旨在解决在没有logit访问的情况下量化大型语言模型(LLM)中的不确定性这一普遍挑战。共形预测(CP)以其模型不可知和无分布的特性而闻名,是各种LLM和数据分布所需的方法。然而,LLM的现有CP方法通常假定可以访问logits,而这对于某些仅限API的LLM是不可用的。此外,已知logits校准错误,可能导致CP性能下降。为了应对这些挑战,我们引入了一种新的CP方法,该方法(1)适用于没有logitaccess的单API LLM;(2) 最小化预测集的大小;以及(3)确保用户定义的覆盖范围的统计保证。这种方法的核心思想是使用粗粒度(即样本频率)和细粒度的不确定性概念(例如语义相似性)来制定不一致性度量。在封闭式和开放式问答任务上的实验结果表明,我们的方法在很大程度上优于基于logit的CP基线。

1 引言

2 共形预测的前言

3 方法

4 实验

5 相关工作

6 结论

我们研究了无登录访问的无API LLM的CP的关键问题。我们提出了一种新的解决方案,通过利用来自不同来源的不确定性信息来定义不合格评分函数。特别是,在有限的采样预算下&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值