RAG
文章平均质量分 92
fundroid
Android GDE(谷歌开发者专家)| 互联网大厂移动端架构师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RAG 优化大全:从基础到前沿,构建更智能的问答系统
摘要:检索增强生成(RAG)技术通过结合外部知识库与大型语言模型,有效解决了模型内容过时和幻觉问题。本文系统梳理了RAG的优化框架,涵盖检索前(数据清洗、分块策略、查询扩展)、核心检索(混合检索、重排序)和检索后(上下文压缩、提示工程)三大环节。同时介绍了双重检索、缓存机制等系统级优化策略,为构建高效精准的RAG应用提供实践指南。文章强调RAG优化是系统工程,需要从数据质量、检索精度到生成效果进行全链路优化,并指出自适应RAG、图RAG等前沿发展方向。原创 2026-04-22 08:30:00 · 405 阅读 · 0 评论 -
端侧 RAG:让你的 App 拥有离线智能的记忆
摘要:端侧RAG技术让App具备离线智能记忆能力,解决云端LLM处理私有数据时的隐私和网络依赖问题。通过本地化检索增强生成(RAG)流程,系统先将数据分块转换为向量嵌入,再利用HNSW算法高效检索,最后生成精准回答。该技术实现了知识实时更新、扩展性强和上下文聚焦等优势,同时需处理数据预处理、冷启动优化和增量更新等工程挑战,为移动设备提供隐私安全、低延迟的个性化AI服务。原创 2026-04-02 08:30:00 · 416 阅读 · 0 评论
分享