- 博客(2)
- 问答 (2)
- 收藏
- 关注
原创 高级RAG特性之一 - 查询压缩
这个问题时,把历史记录跟问题一并发送给AI,除了可能会超出AI接口的最大请求token数,还会影响AI的回复速度。此时执行压缩工作的AI可以选用支持长文本的AI,不一定是真正回答问题的AI。不管是在RAG还是AI对话的场景,为了能让AI更好的理解当前问题,往往会把历史对话跟当前问题一并发送。但是如果把历史记录去掉,不跟随用户问题一起发送,则AI会无法理解用户问题中的“他”指的是什么。将历史记录与用户问题提炼压缩,将长文本内容压缩成直指问题核心的AI可以理解的短文本。
2024-05-22 14:23:45 425
原创 RAG应用实践-基于大模型构建知识库(Java版本)
目前大部分基于大模型的应用都是用python写的,本文使用java实现一个基于大模型的知识库(RAG系统)。
2024-02-28 14:49:50 2450 6
空空如也
关于项目代码管理的(CVS或SVN)权限问题
2010-08-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人