《向量数据库指南》——AI应用长文本与RAG通用对比

最新推荐文章于 2024-09-26 17:23:00 发布

ModaHub魔搭社区

最新推荐文章于 2024-09-26 17:23:00 发布

阅读量676

点赞数 5

文章标签：人工智能大数据算法 VectorDBBench 低代码 milvus Milvus Cloud

LCHub

本文链接：https://blog.csdn.net/qinglingye/article/details/141278950

版权

长文本与RAG通用对比

准确率：通常情况下长文本优于RAG

长文本：可更加综合的去分析所有相关的内容，提取相关数字，生成图表，效果尚可。
RAG：更适合找到一段或者是几段可能相关的段落。如果希望大模型能够对问题有全局的认识，比较困难。如，根据上市公司的2020年财务报表，绘制图表，直接用RAG可能效果就不是很好。

长文本在准确性上表现好的原因，以及长度与准确性选择

长文本处理之后，会做对齐和专门的Benchmark测试调整。比如说之前的大海捞针以及腾讯的数星星的Benchmark，这些是更难一些要求，不仅要找到相关的位置，还得把具体的数字给出来。
现在也出现了一些新的关于长文本模型的bench mark，比如legal bench，它就是专门测长文本模型的retrieval 和reasoning 的能力。然后如果大家对这个方面的推理有兴趣的话，可以去搜，最近有一些论文是比较相关的。
从实际应用出发，其实几十 k token的输入量量并不算很多，现在一般的大语言模型都能满足。用额外的辅助，就有点像为了10本书，去搞一个图书馆，可能不太需要。但是如果对这 10 本书有什么特殊的需求，没准也需要搞一个图书馆，

最低0.47元/天解锁文章

ModaHub魔搭社区

关注

5
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ModaHub魔搭社区 共建低代码生态

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。