ModaHub魔搭社区测评GPTCache

ModaHub魔搭社区

于 2023-07-04 10:00:00 发布

阅读量178

点赞数

分类专栏：《向量数据库指南》《实战AI大模型》魔搭GPT 文章标签：人工智能魔搭社区向量数据库 ModaHub AI模型

LCHub

本文链接：https://blog.csdn.net/qinglingye/article/details/131441386

版权

《向量数据库指南》同时被 3 个专栏收录

536 篇文章 56 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

《实战AI大模型》

189 篇文章 11 订阅 ¥129.90 ¥299.90

订阅专栏

超级会员免费看

49 篇文章 3 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了GPTCache的性能测评，通过实验展示了其在区分相关和不相关查询上的有效性，达到近50%的命中率。GPTCache已应用于OSSChat并计划接入更多LLM模型和向量数据库。

摘要由CSDN通过智能技术生成

为评估 GPTCache 的性能，我们选取了一个数据集，其中包含三种句子对：语义相同的正样本、语义相关但不完全相同的负样本、语义完全不相关的中间样本。

MODAHUB让AI模型应用落地更简单

实验 1

为了确定基线（baseline），我们先将 30,000 个正样本的键存入缓存中。接下来，我们随机选择 1,000 个样本，并使用对应的另 1,000 条句子（句子对中的另一个句子）作为查询语句。
以下是我们获得的结果：

我们发现，将 GPTCache 的相似性阈值设置为 0.7 可以较好地平衡命中率和负相关比率。因此，所有后续测试中都会应用这个设置。
用 ChatGPT 生成的相似度分数来确定缓存的结果是否与查询问题相关。将正样本阈值设置为 0.6，使用以下 prompt 生成相似度分数：

（注：以上 prompt 为中文翻译。原文请见：https://zilliz.com/blog/Yet-another-cache-but-for-ChatGPT）
实验 2

进行包含 50％正样本和 50％负样本的查询，在运行 1,160 个请求后，产生了如下结果：

命中率几乎达到了 50％，命中结果中的负样本比例与实验 1 相似。这说明 GPTCache 善于区分相关及不相关的查询。

目录

MODAHUB让AI模型应用落地更简单

了解本专栏

超级会员免费看

ModaHub魔搭社区

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
ModaHub魔搭社区测评GPTCache

实验 3将所有负样本插入到缓存中，并使用它们句子对中的另一个句子作为查询。接下来，我们随机选择 1,000 个样本，并使用对应的另 1,000 条句子（句子对中的另一个句子）作为查询语句。以上就是团队进行的典型实验，目前，我们已将 GPTCache 集成到 OSSChat 聊天机器人中，并努力收集生产环境中的统计数据。为评估 GPTCache 的性能，我们选取了一个数据集，其中包含三种句子对：语义相同的正样本、语义相关但不完全相同的负样本、语义完全不相关的中间样本。因此，所有后续测试中都会应用这个设置。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ModaHub魔搭社区 共建低代码生态

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。