- 博客(186)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 Agent记不住历史信息?
AI系统在处理长文本或多轮对话时容易出现"失忆"问题,主要受限于Transformer架构的上下文窗口限制和信息稀释效应。本文介绍了六种提升AI记忆能力的方法:1)上下文缓存与滑动窗口;2)向量数据库+RAG检索;3)MemoryTransformer架构;4)∞-former理论无限长处理;5)层次化记忆架构;6)多Agent记忆共享。这些方案从简单到复杂,可根据不同场景需求选择,如短对话用滑动窗口,长文档用RAG检索,超长序列用∞-former等。
2026-03-16 16:34:31
358
原创 如何让Agent智能选工具?
本文系统介绍了让AI Agent智能选择工具的四种方法:规则匹配、LLM自由生成、Softmax采样和Gumbel-Softmax。规则匹配简单但泛化差;LLM生成利用语义但输出不稳定;Softmax引入概率却无法训练;Gumbel-Softmax通过可微的离散采样实现端到端学习,让Agent能从错误中不断优化,准确理解语义并选择合适工具。文章对比了各方法的优缺点,并指出Gumbel-Softmax是构建高准确率、自适应Agent的最佳选择。
2026-03-16 16:11:47
382
原创 基于 Top Agent 与 Tool Agent 的协同调度架构
本文提出一种分层协同架构(TopAgent+ToolAgent),解决智能体系统在工具增多时出现的效率低下问题。通过将决策与执行分离,TopAgent负责任务规划与调度,ToolAgent专注工具调用与执行,实现并行处理、动态调整和闭环控制。相比单Agent方案,该架构在效率、可控性、可观测性和可扩展性方面均有显著提升,适合复杂任务场景。建议根据需求选择AutoGPT或LangGraph框架实现,为构建高效智能体系统提供新思路。
2026-03-16 15:45:27
684
原创 什么是Agentic RAG?
AgenticRAG是RAG技术的进化形态,通过引入智能体(Agent)作为控制中枢,使系统从被动信息检索升级为主动任务执行。
2026-03-16 10:41:21
572
原创 提示词效果不稳定?
摘要:本文探讨了提示词效果不稳定的问题及解决方案。通过分析语义模糊、缺乏上下文等四大原因,提出"上下文融合Prompt工程"概念,即通过提供背景信息提升模型理解。重点介绍了五种实用策略:少样本提示、思维链推理、外部知识引入、对话历史融合和结构化模板,并介绍了动态上下文注入的进阶方法。实践表明,合理融入上下文能显著提升生成质量,建议明确任务目标、收集相关上下文、优化提示结构并控制长度,最终实现稳定高效的内容生成。
2026-03-14 22:53:59
105
原创 大模型生成内容出错
摘要:本文探讨了大模型生成内容中的"幻觉"问题,提出融合事实验证链与溯源标注机制的RAG优化方案。通过LlamaIndex和LangChain框架的代码实战,展示了如何强制模型在输出答案时同步标注关键事实来源,实现答案与证据的强关联。该方案具有可审计性、幻觉抑制和信任增强三大优势,能够有效管控大模型输出质量,使AI系统真正做到"言之有据"。文章详细介绍了两种实现方法:LlamaIndex的溯源标注和LangChain的事实验证链构建。
2026-03-14 22:28:51
195
原创 模型忽略关键实体怎么办?
摘要:针对大语言模型忽略关键实体的问题,本文提出三种解决方案。首先分析问题的根源在于注意力机制对重要实体的权重分配不足,导致模型答非所问。解决方法包括:1)提示词工程,通过明确要求引导模型关注特定内容;2)命名实体识别,预先提取关键实体作为额外信息;3)输出层干预技术,直接调整关键实体的生成概率。三种方法各具优势,可单独或组合使用,其中输出层干预效果最直接但需控制力度。实际应用中建议根据需求选择合适方案,使模型既能准确捕捉重点,又能自然流畅地生成内容。
2026-03-14 22:00:42
165
原创 RAG如何科学调节切片长度与滑动窗口?
摘要:RAGAS是一个专为RAG系统设计的评估工具,通过四个核心指标(答案相关性、上下文相关性、召回率、忠实度)量化评估系统性能。文章介绍了如何利用RAGAS科学调节切片长度和滑动窗口参数,通过建立测试集、尝试不同参数组合并对比评分数据,实现从主观判断到数据驱动的优化转变。这种方法能有效解决传统人工评估的主观性和低效问题,帮助开发者快速找到最优参数配置,提升RAG系统的整体性能。
2026-03-14 18:23:33
166
原创 RAG政策文档检索总是漏关键点?
HiRAG(分层知识检索增强生成)系统通过模拟人类阅读方式,有效解决传统RAG在处理政策文档时的关键信息遗漏问题。传统RAG存在上下文碎片化、语义关联缺失等缺陷,而HiRAG采用三级检索机制:先定位细节内容,再向上追溯上下文背景,最后关联文档整体结构。这种层次化知识索引方式,结合知识图谱技术,使系统能准确检索政策金额、适用条件等完整信息,避免"断章取义"。实验表明,HiRAG在政策法规等结构化文档检索中,显著提升了信息完整性和理解准确性。
2026-03-14 18:18:43
280
原创 RAG多路召回融合难?
摘要:多路召回融合是提升RAG系统检索质量的关键技术。文章分析了单一检索方式的局限性,提出同时使用向量检索、关键词匹配和知识图谱等多路召回策略。针对融合过程中的三大难点(得分不可比、结果重复、阈值难定),介绍了四种实用策略:加权融合(分配权重计算综合得分)、去重处理(保留唯一文档)、阈值过滤(动态剔除低分结果)和大模型重排序(利用LLM精细评分)。文章强调应根据业务场景在效率与质量间权衡,建议组合使用多种策略,先快速筛选再精细排序,实现检索效果的优化提升。
2026-03-14 18:06:10
326
原创 RAG用户查询太模糊?
本文针对RAG系统中用户查询模糊的问题,提出三种查询扩展方法提升检索精准度。首先分析用户查询模糊的原因在于缺乏上下文和具体需求。然后详细介绍三种实用方法:1)问题改写,通过补充背景信息使查询更具体;2)假设性答案检索(HyDE),先生成理想答案再检索;3)多步检索,将复杂查询分解为子问题。文章通过旅游场景实例展示三种方法的递进效果,并建议通过数据集评估优化效果。最后强调可根据业务需求灵活组合这些方法,以显著提升RAG系统的检索质量。
2026-03-14 17:45:06
291
原创 RAG向量检索HNSW参数调优难?
HNSW算法在向量检索中性能优越但内存占用大,Faiss的SQ8量化技术可将128维向量的内存占用从512字节压缩至128字节,降低75%。实验显示,10万条128维向量数据的内存从48.83MB降至12.21MB,训练时间从27.73秒缩短到4.65秒,同时保持60%的Top-1结果一致性。通过调整M、efConstruction等参数可平衡速度与准确率,SQ8适用于移动端等内存敏感场景,SQ16则适合高精度需求。代码示例展示了HNSW与HNSW+SQ8的性能对比,量化技术有效解决了HNSW的内存瓶
2026-03-14 17:15:43
444
原创 RAG设计高效混合检索架构提升召回精度
混合检索技术通过结合关键词匹配(BM25)和语义向量检索的优势,有效提升RAG系统的召回精度。典型架构包含关键词通道、语义通道和结果重排序三个核心组件,既保证精确匹配又拓展语义相关结果。主流工具如Dify、Qdrant等提供多样化稀疏嵌入方案和可视化参数配置,支持权重调整和阈值设置。这种混合方法在复杂信息检索任务中能显著提高结果的全面性和准确性,是构建高效RAG系统的关键技术。
2026-03-14 16:45:35
389
原创 RAG如何选择最适合业务的向量检索引擎?
RAG系统检索引擎选型指南:BM25、FAISS和HNSW对比分析 在RAG系统中,检索引擎的选择直接影响系统性能。本文对比了三种主流方案:BM25基于关键词匹配,适合冷启动和小规模数据,可解释性强但无法语义匹配;FAISS采用向量近似搜索,适合百万级数据,支持GPU加速但训练成本高;HNSW基于图结构索引,召回率高且延迟低,但内存占用大。选型需综合考虑数据量(10万以下用BM25,百万级用HNSW或FAISS)、延迟要求和硬件预算。实际应用中可结合业务场景特点,如FAQ推荐BM25,电商搜索建议HNSW,
2026-03-14 10:55:59
381
原创 从PDF到RAG知识库
本文介绍了一种可配置、可扩展的自动化预处理流水线,用于将PDF/图片等文档转化为RAG知识库。该方案通过PaddleOCR提取文本,经过预处理分段后上传至Dify知识库并绑定元数据,实现全流程自动化。核心设计采用配置驱动和插件化架构,所有参数通过config.yaml管理,预处理规则支持插件扩展。系统包含OCR提取、文本处理、知识库上传和元数据绑定四大模块,并支持Celery异步任务处理。这种模块化设计不仅提升处理效率,还能灵活适应不同业务场景,为RAG系统提供高质量的数据基础。
2026-03-13 22:22:22
190
原创 RAG动态切片策略与重叠机制
本文探讨了RAG系统中文档切片的核心问题——上下文碎片化及其解决方案。文章分析了固定切片导致语义断裂、信息稀释等三大影响,提出动态切片和重叠机制两种互补策略:动态切片通过语义/结构感知实现自适应切分(如LlamaIndex的SemanticSplitter),重叠机制则通过保留10%-20%重复内容维护连贯性。同时介绍了层次化检索(Dify父子模式)、命题检索等进阶方案,以及商业工具(RAGFlow)的模板化实践。最后强调应根据文档类型选择策略组合,并通过持续评估优化切片效果,为精准检索提供保障。
2026-03-13 22:10:03
338
原创 RAG切片语义割裂怎么办?
本文探讨了RAG系统中文档切片面临的语义割裂问题,提出了四种基础切片方法(Token切片、句子切片、句子窗口切片和语义切片)并分析其优缺点。针对单一方法的局限性,作者提出混合策略:先用语义切片划分段落,再用滑动窗口控制大小。这种方案既保证语义完整又控制切片长度,适用于高要求的生产场景。文章建议根据文档特点选择切片策略,并通过实验评估优化参数,为构建高效RAG系统提供实用指南。
2026-03-13 21:57:26
758
原创 RAG领域术语总混淆?
摘要:检索增强生成(RAG)系统常面临术语混淆问题,如同词异义、领域差异等导致检索精度下降。本文系统分析四大混淆根源(多义词、同义词、领域差异、企业术语),提出构建结构化术语词库的解决方案,详细说明词库字段设计及构建流程。重点阐述术语词库与RAG全流程的集成方法,包括数据预处理标准化、语义增强嵌入、多路混合检索、生成控制与评估优化五个关键阶段,并给出各环节的伪代码实现示例。通过建立术语一致性闭环,可显著提升RAG系统的专业性和准确性。
2026-03-13 21:43:34
341
原创 RAG跨页表格怎么自动对齐合并?
摘要:RAG系统中跨页表格处理面临表头重复、行列错位等挑战。本文提出通过表格结构识别(TSR)、合并策略和结构化输出三个关键技术实现自动对齐,并演示使用开源工具MinerU的完整流程:部署环境→解析PDF→输出结构化Markdown/JSON→集成到RAG系统。该方案能有效还原表格完整性,提升检索与生成质量,建议对PDF文档进行预处理以避免信息丢失。
2026-03-13 21:24:42
421
原创 RAG如何统一多源文档格式?
本文探讨了构建RAG系统时多源文档格式统一解析的关键策略。文章分析了不同格式文档(Word、PDF、图片等)的解析难度分级,并提出了标准化处理、内容完整性和可扩展性的统一目标。重点介绍了使用python-docx解析Word文档的结构化优势,以及PDF解析从简单文本提取到进阶布局识别的演进路径。文章还分享了Dify框架中的统一接口设计模式,强调通过基类BaseExtractor实现可扩展的多源解析。最后提出优先使用结构化格式、分阶段优化等最佳实践,为构建健壮的RAG系统奠定数据基础。
2026-03-13 20:53:50
1007
原创 软件工程状态转换图
状态转换图的概念状态转换图(State Transform Diagram,STD)通过描绘系统的状态及引起系统状态转换的事件,来表示系统的行为。此外,状态图还指明了作为特定事件的结果系统将做哪些动作(例如,处理数据)。 状态是任何可以被观察到的系统行为模式,一个状态代表系统的一种行为模式。状态规定了系统对事件的响应方式。系统对事件的响应,既可以是做一个(或一系列)动作,也可以是仅仅改变系统本身的状态,还可以是既改变状态又做动作。状态转换图的状态有三种包括初态(即初始状态) 、终态(即最终状态)和
2022-05-01 15:40:23
41931
3
原创 软件工程实体-联系图
文章目录ER图分为实体、属性、关系三个核心部分ER图中关联关系有三种ER实体的简单例子ER图分为实体、属性、关系三个核心部分ER图的实体(entity)实体是长方形体现 从属实体使用圆角矩形表示即数据模型中的数据对象,例如人、学生、音乐都可以作为一个数据对象,用长方体来表示,每个实体都有自己的实体成员(entity member)或者说实体对象(entity instance),例如学生实体里包括张三、李四等,实体成员(entity member)/实体实例(entity instance) 不需要出
2022-05-01 11:15:56
3524
ssm-crud.zip
2020-05-10
scrapy模块进行爬虫报错
2022-12-27
关于#爬虫#的问题:请问一下为什么执行search.py文件后报错
2022-12-28
Redis的Lua脚本报错,不可与空值作比较
2021-09-28
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅