OpenAI 是如何一步一步把RAG做到98%的准确性得

最新推荐文章于 2025-04-01 21:14:40 发布

水的精神

最新推荐文章于 2025-04-01 21:14:40 发布

阅读量3.4k

点赞数 14

分类专栏： RAG 文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/star1210644725/article/details/135477928

版权

RAG 专栏收录该内容

54 篇文章

订阅专栏

参考OpenAI的官方演讲，如何做好RAG。本文整理的内容，均来源于此演讲内容。

【OpenAI演讲-自制中文字幕】干货-如何提升大模型表现？-提示工程、RAG与Fine-Tuning技巧详解_哔哩哔哩_bilibili

45% 的准确性

普通搜索不做任何处理的效果，OpenAI基准测试的准确性只有45% 。搜索并不是简单的切分，然后做embedding就能有不错的检索效果。

假设性问题和HyDE 提升到65%

另一个方法是让LLM为每个块生成一个假设性问题，并将这些问题以向量形式嵌入。在运行时，针对这个问题向量的索引进行查询搜索（用问题向量替换我们索引中的块向量），检索后将原始文本块作为上下文发送给LLM以获取答案。这种方法由于查询和假设性问题之间的语义相似性更高，从而提高了搜索质量。

还有一种反向逻辑的方法叫做HyDE——您可以让LLM根据查询生成一个假设性回答，然后将该回答的向量与查询向量一起用来提高搜索质量。

从65%提升到85%

尝试调整文本的切分规则，尝试不同大小的切分逻辑；尝试提取更多的内容信息；rerank 召回的数据；尝试使用模型对文本数据进行分类，不同的领域信息进行分类。将问题也进行分类，最后决定哪些数据最优意义。最后效果提升到了85%

从85%提升到98%

将数字类型的数据提取出来放在关系型数据库，因为模型通常对数据是不敏感的，并且数据检索，对检索来说也是一件很有压力的事情。

查询扩展，将一个问题拆分成问题列表。然后分别取执行查询，然后获取到结果，最后将结果合并。

关于要不要微调

OpenAI 也尝试了去微调文本嵌入模型，但是最后放弃了，因为成本高，时间长，收益小。就像OpenAI所说的，任何问题都想着去用微调来解决问题，就是浪费时间浪费金钱。

那什么时候去做微调有意义呢？通常是模型能够接受的token太小，不能满足我们的业务需求时。还有就是模型有严重的性能问题，回答太慢。再有就是将更大的模型优化成跟小的模型，但是有一样的效果，因为这样可以节省资源，也就是省钱。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。