还是码字踏实-CSDN博客

原创智能体平台Dify的可观测性与MCP

本文介绍了Tracing集成架构的完整链路，从用户请求到监控上报的全流程。架构分为四个阶段：1)工作流执行阶段通过事件监听记录执行数据；2)追踪任务异步入队阶段实现业务与监控解耦；3)定时聚合阶段每5秒批量处理100个任务；4)Celery异步上报阶段完成数据持久化和Langfuse云端上报。关键设计包括非侵入式事件监听、分布式追踪支持（external_trace_id）、全局内存队列实现快速入队，以及异常容错机制确保业务不受监控失败影响。整个流程在保证系统性能的同时，实现了完整的可观测性数据采集。

2026-01-23 15:54:24 730

原创智能体平台Dify的分布式调度与系统吞吐优化

本文解析了基于Celery和Redis的异步任务分发完整链路，适用于GitHub Webhook触发代码审查工作流的场景。流程分为三个阶段：1) 同步接收请求并验证入队（毫秒级），包括配额检查、队列选择和任务存储；2) Worker异步处理（秒/分钟级），通过阻塞式拉取任务、执行LLM调用等耗时操作；3) 可选的结果查询阶段。关键实现包括非阻塞设计、状态追踪机制和基于订阅等级的队列路由策略，通过Flask API、Celery Worker和PostgreSQL的协同实现高效的任务分发与执行。

2026-01-22 17:15:13 759

原创智能体平台Dify的模型接口与 Agent 架构深度解析

1、系统架构流程：从用户请求入口到初始化Agent实例，再到工具调用和结果整合的全链路。2、关键技术点：请求接收与Agent初始化过程历史对话组织与工具回调机制知识库检索工具的动态加载流式工具调用支持判断3、代码级实现细节：展示了BaseAgentRunner和FunctionCallAgentRunner的核心初始化逻辑，包含关键参数说明和功能注释

2026-01-21 19:03:14 739

原创智能体平台Dify的多租户安全模型与沙箱隔离

租户隔离通过tenant_id实现数据库行级隔离，沙箱隔离采用物理隔离技术（Docker网络/文件系统），向量库隔离使用group_id实现向量Payload级过滤。

2026-01-20 21:49:42 754

原创智能体平台Dify的 Dify Sandbox 代码沙箱的请求处理流程

本文详细分析了Dify沙箱服务的完整处理流程和源码实现。服务启动阶段会初始化配置、安装依赖并启动HTTP服务器。路由层通过中间件实现API Key认证、请求数限制和并发控制。核心执行流程包括：代码加密、临时文件生成、沙箱环境初始化、系统调用白名单过滤、降权执行用户代码，并捕获输出结果。安全机制采用Seccomp BPF过滤器、chroot隔离和nobody用户降权，确保代码执行在严格受限的环境中。

2026-01-20 21:09:56 741

原创智能体平台Dify的RAG 架构

多策略检索：支持向量检索（余弦相似度）、关键词检索（TF-IDF）和全文检索（BM25）三路并行检索，提升召回率。从用户查询→多知识库检索→文档去重→重排序→阈值过滤→返回Top结果给LLM，形成端到端解决方案。

2026-01-19 15:25:10 821

原创智能体平台Dify的工作流引擎：事件驱动 DAG 与变量池架构

Dify 工作流引擎采用事件驱动架构和领域驱动设计。核心特点包括：邻接表+动态入度检查的 DAG 调度、双层哈希变量池、PostgreSQL 持久化存储、Worker 并行+Dispatcher 串行的并发控制，以及基于 Layer 系统的资源管控。

2026-01-15 17:19:05 715

原创智能体平台Dify的架构详解

系统采用前后端分离设计，前端(Next.js)通过可视化Canvas生成标准JSON DSL，后端(Flask)专注于DSL解析和执行引擎处理。核心架构包含用户层、API层(Celery异步任务)和持久化层(PostgreSQL)，实现了任务队列分流、协程优化和多租户隔离。系统支持DSL版本化管理，通过工厂模式动态加载节点类型，具有高度可扩展性。Flask负责轻量API处理，Celery处理重计算任务，Redis作为消息总线和缓存，PostgreSQL存储DSL、执行日志和向量数据。

2026-01-13 21:37:15 977

原创企业级 RAG 系统实战的建议

检索增强生成(Retrieval-Augmented Generation, RAG)已成为企业 AI 应用的核心技术。然而,从简单的概念验证到处理 2 万-5 万份企业文档的生产系统,其间的技术鸿沟远超大多数人的想象。本文基于真实的企业级 RAG 项目实践,深入剖析文档质量检测、层级化分块、混合检索、表格处理等关键技术环节,并提供可直接用于生产环境的代码实现。文中所述方案已在制药、金融、法律等受监管行业得到验证,能够将文档检索准确率从 62% 提升至 89%,同时保持可接受的响应延迟和成本。

2025-12-02 17:08:51 1006

原创 ragflow项目源码解读之文本两阶段识别：ocr.py

本文介绍了OCR系统的两阶段架构设计及核心实现细节。系统采用检测-识别分离架构，TextDetector负责定位文本区域，TextRecognizer负责识别文本内容。核心类OCR协调整个流程，支持多GPU并行处理，包含智能排序、旋转识别等优化方法。TextDetector通过预处理、归一化和后处理实现高效文本检测。系统通过置信度过滤、阅读顺序恢复和竖排文字处理等技术创新，显著提升了OCR的准确率和适用性。

2025-11-27 22:56:58 1051

原创搜索与图论算法之深度优先搜索(DFS)的岛屿类问题和单词搜索、广度优先搜索(BFS)的BFS求最短路径、拓扑排序的课程类问题

本文介绍了三类岛屿问题的DFS/BFS解法。1)岛屿数量问题通过遍历网格，遇到陆地时计数并递归淹没相连陆地；2)岛屿最大面积问题在遍历时递归计算每个岛屿面积并记录最大值；3)被围绕区域问题先标记边界安全区域，再将内部不安全区域转换为X。此外还介绍了单词搜索问题，通过DFS+回溯匹配单词字符，使用临时标记避免重复访问。这些问题的核心思路都是利用DFS/BFS遍历相邻元素，配合标记和回溯技巧解决问题。

2025-11-26 14:34:44 767

原创 LLM时代的表格问答TQA：任务、方法与评估的全面综述

本文综述了大语言模型时代表格问答（TQA）的研究进展。TQA旨在基于表格数据回答自然语言问题，涉及表格理解、复杂查询处理等核心挑战。文章系统梳理了TQA任务的多样性，包括表格表示形式、问题复杂度、答案格式、模态维度和领域设定。在建模方法上，重点探讨了视觉表格与文本表格的不同处理技术，以及针对复杂查询的微调与无微调方法。研究表明，视觉表格理解仍显著落后于文本表格，而工具增强的无微调方法在精确推理方面展现出优势。未来研究需进一步优化表格表示、提升多模态理解能力，并探索更高效的推理机制。

2025-11-24 21:32:24 1193

原创树相关算法之二叉搜索树(BST)：BST的验证和搜索、BST的修改操作、BST的构造

本文介绍了二叉搜索树(BST)的基本概念和常见操作。BST具有左子树节点值小于根节点、右子树节点值大于根节点的特性，其中序遍历结果为升序序列。文章重点讲解了BST的验证、搜索和修改操作，包括验证二叉搜索树的有效性(LeetCode 98)、在BST中搜索指定节点(LeetCode 700)、查找第K小的元素(LeetCode 230)、插入新节点(LeetCode 701)以及删除指定节点(LeetCode 450)等问题。

2025-11-23 18:06:54 1007

原创树相关算法之二叉树路径问题：路径总和(LeetCode 112 简单题)、路径总和II(LeetCode 113 中等题)、路径总和III(LeetCode 437,中等题偏难)

本文介绍了LeetCode中路径总和系列问题的解法，包括路径总和(112)、路径总和II(113)和路径总和III(437)。对于简单题112，采用递归判断是否存在满足条件的路径；中等题113通过DFS回溯找到所有符合条件的路径；难题437使用前缀和与DFS回溯结合，统计任意向下路径的数目。三题解法都体现了递归和回溯的思想，但难度递增，解题策略从简单判断逐步发展为需要维护状态信息进行统计。代码实现展示了如何通过递归和回溯高效解决二叉树路径问题。

2025-11-22 19:21:53 317

原创树相关算法之二叉树层次遍历：二叉树的右视图(LeetCode 199 中等题)、二叉树的锯齿形层序遍历(LeetCode 103 中等题)、二叉树的层平均值(LeetCode 637)

本文介绍了三道二叉树层次遍历相关题目：二叉树的右视图：通过BFS层次遍历，记录每层最后一个节点值。锯齿形层序遍历：交替改变遍历方向，使用布尔值标记是否需要反转当前层结果。二叉树的层平均值：计算每层节点值的平均数。三道题均采用BFS算法，核心都是层次遍历框架，通过维护队列处理每层节点，区别在于对每层节点的处理方式不同。时间复杂度均为O(n)，空间复杂度O(n)。

2025-11-22 14:44:00 272

原创基于BM25的金融文档智能解析：基于OCR和紧凑型视觉语言模型的多阶段字段提取技术深度解读

本文提出了一种多阶段金融文档解析框架，通过图像预处理、OCR转写、BM25页面检索和紧凑型视觉语言模型（VLM）提取四个步骤，有效解决了中小企业财务文档处理中的规模庞大、质量低下、多语言混杂和结构异构等问题。该框架采用8B参数的miniCPM-o 2.6模型，结合BM25检索算法，在保证准确率的同时显著降低了计算成本和延迟。实验表明，相比直接使用大型VLM，该方法在准确率提升8.8倍的同时，GPU成本降低到0.7%，延迟减少92.6%，为金融科技领域的文档智能处理提供了高效实用的解决方案。

2025-11-21 16:14:39 1660

原创 MonkeyOCR v1.5：解锁复杂文档解析的鲁棒性

1. 简化而高效的两阶段Pipeline： ○ 将复杂的多阶段流水线简化为两阶段 ○ 通过VLM联合预测布局和阅读顺序，增强视觉-结构一致性 ○ 在准确性和效率之间达到了新的平衡点2. 视觉一致性强化学习范式： ○ 首次系统性地应用GRPO算法于文档解析 ○ 提出"渲染-对比"机制作为奖励信号 ○ 显著减少了对大规模手工标注的依赖3. 复杂场景的系统性解决方案： ○ IDTP模块解决了表格内嵌图像问题 ○ TGTM模块实现了跨页/跨列表格的智能合并

2025-11-20 18:07:05 1122

原创 MosaicDoc：面向视觉丰富文档理解的大规模双语基准数据集深度解析

MosaicDoc数据集和DocWeaver流水线，解决了文档理解领域的关键挑战。针对现有数据集布局简单、语言单一、阅读顺序标注缺失等问题，MosaicDoc提供72,000+图像和620,000+双语问答对，专门针对报纸杂志等复杂布局文档。DocWeaver创新性地采用多智能体协作流水线，实现文档分解、复杂阅读顺序建模和高保真QA生成。核心技术包括HTML对齐方法、语义序列与布局层次混合策略，以及视觉中心流水线，有效处理了非线性布局、跨页关联和多模态融合等难题。

2025-11-19 23:29:41 949

原创基础数据结构之单调栈：下一个更大元素(LeetCode 496 简单题, LeetCode 503 中等题)、每日温度(LeetCode 739 中等题）

单调栈应用总结这三道题目均利用单调栈解决元素右侧更大值的问题，核心思路是维护一个单调递减栈，通过比较栈顶元素与当前元素来确定下一个更大元素。 LeetCode 496：通过反向遍历nums2构建单调栈，记录每个元素的下一个更大元素，最后映射到nums1。 LeetCode 503：处理循环数组时，使用虚拟双数组和取余操作，通过反向遍历维护单调栈，解决循环查找问题。 LeetCode 739：正向遍历温度数组，利用单调栈记录未找到更高温度的日期索引，计算天数差作为答案。

2025-11-18 20:04:31 274

原创 SQLBot智能问数系统深度解析：基于RAG的Text-to-SQL技术全景剖析

Text-to-SQL技术发展经历了从规则驱动到神经网络再到大型语言模型的演进过程，但当前仍面临模式理解、语义歧义和跨域泛化等挑战。SQLBot作为开源项目，通过检索增强生成(RAG)技术结合prompt工程，提供了轻量级智能问数解决方案。其核心流程包括问题预处理、数据源选择、模式检索与SQL生成四阶段，支持多种数据库并采用自定义M-Schema格式表示模式。该系统设计简洁，强调prompt驱动而非模型微调，具备开箱即用和可视化集成特点，为解决Text-to-SQL实际应用难题提供了新思路。

2025-11-17 21:45:50 1293 1

原创基础数据结构之栈的经典题目：括号匹配(有效的括号 LeetCode 20 简单题)、最小栈(LeetCode 155 中等题)、逆波兰表达式求值(LeetCode 150 中等题)

这三道LeetCode题目都涉及栈的应用：括号匹配：使用栈检查括号的有效性，左括号入栈，右括号与栈顶匹配，最后栈空则有效。最小栈：设计支持O(1)获取最小值的栈结构，使用辅助栈同步存储最小值。逆波兰表达式求值：利用栈计算后缀表达式，遇到运算符就弹出两个操作数运算后将结果压回栈中。共同点在于都利用了栈的后进先出特性，分别解决了括号匹配、最小值和表达式计算问题。解题时都需要注意边界条件处理，如空栈判断和特殊输入情况。

2025-11-17 21:07:40 456

原创 RAG系统中的文档解析挑战

本文探讨了RAG系统中文档解析的关键性及技术演进。文档解析将非结构化文档转换为机器可理解格式，是RAG性能的基础。传统管道式架构模块化强但存在误差累积问题，而新兴视觉语言模型(VLM)虽能端到端解析却面临幻觉和计算成本挑战。文章重点分析了表格识别的多维挑战（如误检测、结构复杂性）及解决方案，包括多模态验证、后处理筛查和专用模型应用。混合架构结合了传统方法与VLM优势，成为当前主流趋势。文档解析质量直接影响RAG系统效果，需根据应用场景权衡准确性、效率与成本。

2025-11-17 00:30:28 1453

原创 query加强之深度解析ReDI：通过分解与解释增强query理解的推理方法

ReDI论文的主要贡献可以概括为:1. 理论贡献:证明了对于复杂查询,分解仍然是有效的方法,但需要配合解释来提升检索性能2. 方法创新:设计了三阶段pipeline(分解-解释-融合),针对稀疏和稠密检索定制化解释策略3. 数据资源:构建并开源了3403条真正需要多源推理的复杂查询数据集Coin4. 实用价值:通过知识蒸馏实现了生产级部署,使用8B模型达到或超越671B模型的性能

2025-11-16 21:36:34 746

原创 GraphSearch：图检索增强的深度搜索工作流

本文深入解读GraphSearch论文，提出了一种基于智能体的深度搜索工作流，显著提升了GraphRAG系统处理复杂查询的能力。GraphSearch通过模块化深度搜索管道（包含查询分解、上下文精炼等6个核心模块）和双通道检索策略，实现了多轮迭代和反思推理。该系统可无缝集成现有GraphRAG框架，在6个多跳QA基准上表现优异。论文详细剖析了技术背景、核心机制和实验验证，指出其计算成本和提示词依赖等局限，同时强调其即插即用的特性和作为GraphRAG发展方向的重要性，为知识密集型应用提供了实用解决方案。

2025-11-15 15:49:24 1381

原创 Doc-Researcher: 多模态文档深度研究系统的技术解析

系统通过深度多模态解析保留文档的视觉语义信息，支持跨模态和多粒度自适应检索，并采用迭代多智能体工作流进行深度研究。系统采用离线-在线架构，离线阶段解析文档为多粒度表示，在线阶段通过PlannerAgent分解查询，SearcherAgent执行多模态检索，RefinerAgent精炼证据。

2025-11-12 22:41:25 1237 2

原创基础数据结构之链表的链表排序：排序链表（归并排序）(LeetCode 148 中等题)

本文提供了两种Python解法（递归法和迭代法）来对链表进行升序排序。递归法通过快慢指针找到中点分割链表，分别排序后合并；迭代法则通过计算链表长度，分步合并相邻子链表。两种方法都调用了相同的merge函数来合并有序链表，并注意在类方法中使用self关键字调用。代码实现完整，边界处理完善，适用于链表排序问题。

2025-11-11 10:31:40 203

原创基础数据结构之链表的合并链表：合并两个有序链表(LeetCode 21 简单题)

摘要：该算法实现将两个升序链表合并为一个新的升序链表。通过使用哨兵节点处理边界情况，通过双指针遍历比较节点值，将较小值依次链接到新链表中。当任一链表遍历完成后，将剩余节点直接链接到新链表末尾。时间复杂度为O(m+n)，空间复杂度为O(1)。该解法简洁高效，适用于链表合并问题。

2025-11-10 10:39:25 220

原创 SmartResume简历信息抽取框架深度解析

摘要本研究提出一种融合版面分析与高效大语言模型的简历解析框架，解决文档异构性、LLM高成本和评估标准化三大挑战。系统采用混合PDF解析与YOLOv10版面检测，将复杂布局转换为带行号索引的线性文本流。创新性地使用任务分解与索引指针机制，配合微调Qwen3-0.6B模型，在保持高准确率的同时显著降低延迟。通过两阶段自动评估协议实现细粒度性能度量，为工业级部署提供可靠支持。该方法已成功应用于阿里巴巴HR平台，实现实时高效的简历结构化处理。

2025-11-09 23:47:34 1323

原创基础数据结构之链表的反转链表：反转链表的一部分(LeetCode 92 中等题)

摘要：本文提出了一个反转单链表指定区间节点的算法。使用哨兵节点处理头节点反转的特殊情况，通过找到区间前驱节点后，采用头插法将区间内节点逐步移动到前面实现反转。算法通过维护pre、start和then三个指针，每次操作将then节点插入到区间起始位置，确保不断链。时间复杂度O(n)，空间复杂度O(1)。

2025-11-09 11:15:42 178

原创 FastAPI深度解析

FastAPI 是一个快速崛起的 Python Web 框架，基于 Starlette(ASGI) 和 Pydantic 构建，具有出色的性能和开发效率。其核心优势包括：1) 采用分层架构实现关注点分离；2) 内置依赖注入系统提升代码复用和测试性；3) 严格遵循 OpenAPI 标准自动生成文档；4) 充分利用 Python 类型提示实现类型安全。Benchmark 显示 FastAPI 性能接近 Node.js 和 Go 框架，同时保持 Python 的开发便利性，使其成为现代 Web 开发的理想选择。

2025-11-06 20:35:40 623

行人重识别近年来顶会论文和代码

显著性检测近年来顶会论文和代码

空空如也