自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

专注人工智能应用领域

跟进前沿技术,深入实践解决rag、agent等痛点问题

  • 博客(60)
  • 资源 (2)
  • 收藏
  • 关注

原创 智能体平台Dify的可观测性与MCP

本文介绍了Tracing集成架构的完整链路,从用户请求到监控上报的全流程。架构分为四个阶段:1)工作流执行阶段通过事件监听记录执行数据;2)追踪任务异步入队阶段实现业务与监控解耦;3)定时聚合阶段每5秒批量处理100个任务;4)Celery异步上报阶段完成数据持久化和Langfuse云端上报。关键设计包括非侵入式事件监听、分布式追踪支持(external_trace_id)、全局内存队列实现快速入队,以及异常容错机制确保业务不受监控失败影响。整个流程在保证系统性能的同时,实现了完整的可观测性数据采集。

2026-01-23 15:54:24 273

原创 智能体平台Dify的 分布式调度与系统吞吐优化

本文解析了基于Celery和Redis的异步任务分发完整链路,适用于GitHub Webhook触发代码审查工作流的场景。流程分为三个阶段:1) 同步接收请求并验证入队(毫秒级),包括配额检查、队列选择和任务存储;2) Worker异步处理(秒/分钟级),通过阻塞式拉取任务、执行LLM调用等耗时操作;3) 可选的结果查询阶段。关键实现包括非阻塞设计、状态追踪机制和基于订阅等级的队列路由策略,通过Flask API、Celery Worker和PostgreSQL的协同实现高效的任务分发与执行。

2026-01-22 17:15:13 465

原创 智能体平台Dify的 模型接口与 Agent 架构深度解析

1、系统架构流程:从用户请求入口到初始化Agent实例,再到工具调用和结果整合的全链路。2、关键技术点:请求接收与Agent初始化过程历史对话组织与工具回调机制知识库检索工具的动态加载流式工具调用支持判断3、代码级实现细节:展示了BaseAgentRunner和FunctionCallAgentRunner的核心初始化逻辑,包含关键参数说明和功能注释

2026-01-21 19:03:14 585

原创 智能体平台Dify的 多租户安全模型与沙箱隔离

租户隔离通过tenant_id实现数据库行级隔离,沙箱隔离采用物理隔离技术(Docker网络/文件系统),向量库隔离使用group_id实现向量Payload级过滤。

2026-01-20 21:49:42 640

原创 智能体平台Dify的 Dify Sandbox 代码沙箱的请求处理流程

本文详细分析了Dify沙箱服务的完整处理流程和源码实现。服务启动阶段会初始化配置、安装依赖并启动HTTP服务器。路由层通过中间件实现API Key认证、请求数限制和并发控制。核心执行流程包括:代码加密、临时文件生成、沙箱环境初始化、系统调用白名单过滤、降权执行用户代码,并捕获输出结果。安全机制采用Seccomp BPF过滤器、chroot隔离和nobody用户降权,确保代码执行在严格受限的环境中。

2026-01-20 21:09:56 596

原创 智能体平台Dify的RAG 架构

多策略检索:支持向量检索(余弦相似度)、关键词检索(TF-IDF)和全文检索(BM25)三路并行检索,提升召回率。从用户查询→多知识库检索→文档去重→重排序→阈值过滤→返回Top结果给LLM,形成端到端解决方案。

2026-01-19 15:25:10 691

原创 智能体平台Dify的工作流引擎:事件驱动 DAG 与变量池架构

Dify 工作流引擎采用事件驱动架构和领域驱动设计。核心特点包括:邻接表+动态入度检查的 DAG 调度、双层哈希变量池、PostgreSQL 持久化存储、Worker 并行+Dispatcher 串行的并发控制,以及基于 Layer 系统的资源管控。

2026-01-15 17:19:05 622

原创 智能体平台Dify的架构详解

系统采用前后端分离设计,前端(Next.js)通过可视化Canvas生成标准JSON DSL,后端(Flask)专注于DSL解析和执行引擎处理。核心架构包含用户层、API层(Celery异步任务)和持久化层(PostgreSQL),实现了任务队列分流、协程优化和多租户隔离。系统支持DSL版本化管理,通过工厂模式动态加载节点类型,具有高度可扩展性。Flask负责轻量API处理,Celery处理重计算任务,Redis作为消息总线和缓存,PostgreSQL存储DSL、执行日志和向量数据。

2026-01-13 21:37:15 742

原创 企业级 RAG 系统实战的建议

检索增强生成(Retrieval-Augmented Generation, RAG)已成为企业 AI 应用的核心技术。然而,从简单的概念验证到处理 2 万-5 万份企业文档的生产系统,其间的技术鸿沟远超大多数人的想象。本文基于真实的企业级 RAG 项目实践,深入剖析文档质量检测、层级化分块、混合检索、表格处理等关键技术环节,并提供可直接用于生产环境的代码实现。文中所述方案已在制药、金融、法律等受监管行业得到验证,能够将文档检索准确率从 62% 提升至 89%,同时保持可接受的响应延迟和成本。

2025-12-02 17:08:51 927

原创 ragflow项目源码解读之文本两阶段识别:ocr.py

本文介绍了OCR系统的两阶段架构设计及核心实现细节。系统采用检测-识别分离架构,TextDetector负责定位文本区域,TextRecognizer负责识别文本内容。核心类OCR协调整个流程,支持多GPU并行处理,包含智能排序、旋转识别等优化方法。TextDetector通过预处理、归一化和后处理实现高效文本检测。系统通过置信度过滤、阅读顺序恢复和竖排文字处理等技术创新,显著提升了OCR的准确率和适用性。

2025-11-27 22:56:58 1027

原创 搜索与图论算法之深度优先搜索(DFS)的岛屿类问题和单词搜索、广度优先搜索(BFS)的BFS求最短路径、拓扑排序的课程类问题

本文介绍了三类岛屿问题的DFS/BFS解法。1)岛屿数量问题通过遍历网格,遇到陆地时计数并递归淹没相连陆地;2)岛屿最大面积问题在遍历时递归计算每个岛屿面积并记录最大值;3)被围绕区域问题先标记边界安全区域,再将内部不安全区域转换为X。此外还介绍了单词搜索问题,通过DFS+回溯匹配单词字符,使用临时标记避免重复访问。这些问题的核心思路都是利用DFS/BFS遍历相邻元素,配合标记和回溯技巧解决问题。

2025-11-26 14:34:44 753

原创 LLM时代的表格问答TQA:任务、方法与评估的全面综述

本文综述了大语言模型时代表格问答(TQA)的研究进展。TQA旨在基于表格数据回答自然语言问题,涉及表格理解、复杂查询处理等核心挑战。文章系统梳理了TQA任务的多样性,包括表格表示形式、问题复杂度、答案格式、模态维度和领域设定。在建模方法上,重点探讨了视觉表格与文本表格的不同处理技术,以及针对复杂查询的微调与无微调方法。研究表明,视觉表格理解仍显著落后于文本表格,而工具增强的无微调方法在精确推理方面展现出优势。未来研究需进一步优化表格表示、提升多模态理解能力,并探索更高效的推理机制。

2025-11-24 21:32:24 1099

原创 树相关算法之二叉搜索树(BST):BST的验证和搜索、BST的修改操作、BST的构造

本文介绍了二叉搜索树(BST)的基本概念和常见操作。BST具有左子树节点值小于根节点、右子树节点值大于根节点的特性,其中序遍历结果为升序序列。文章重点讲解了BST的验证、搜索和修改操作,包括验证二叉搜索树的有效性(LeetCode 98)、在BST中搜索指定节点(LeetCode 700)、查找第K小的元素(LeetCode 230)、插入新节点(LeetCode 701)以及删除指定节点(LeetCode 450)等问题。

2025-11-23 18:06:54 996

原创 树相关算法之二叉树路径问题:路径总和(LeetCode 112 简单题)、路径总和II(LeetCode 113 中等题)、路径总和III(LeetCode 437,中等题偏难)

本文介绍了LeetCode中路径总和系列问题的解法,包括路径总和(112)、路径总和II(113)和路径总和III(437)。对于简单题112,采用递归判断是否存在满足条件的路径;中等题113通过DFS回溯找到所有符合条件的路径;难题437使用前缀和与DFS回溯结合,统计任意向下路径的数目。三题解法都体现了递归和回溯的思想,但难度递增,解题策略从简单判断逐步发展为需要维护状态信息进行统计。代码实现展示了如何通过递归和回溯高效解决二叉树路径问题。

2025-11-22 19:21:53 297

原创 树相关算法之二叉树层次遍历:二叉树的右视图(LeetCode 199 中等题)、二叉树的锯齿形层序遍历(LeetCode 103 中等题)、二叉树的层平均值(LeetCode 637)

本文介绍了三道二叉树层次遍历相关题目: 二叉树的右视图:通过BFS层次遍历,记录每层最后一个节点值。 锯齿形层序遍历:交替改变遍历方向,使用布尔值标记是否需要反转当前层结果。 二叉树的层平均值:计算每层节点值的平均数。 三道题均采用BFS算法,核心都是层次遍历框架,通过维护队列处理每层节点,区别在于对每层节点的处理方式不同。时间复杂度均为O(n),空间复杂度O(n)。

2025-11-22 14:44:00 264

原创 基于BM25的金融文档智能解析:基于OCR和紧凑型视觉语言模型的多阶段字段提取技术深度解读

本文提出了一种多阶段金融文档解析框架,通过图像预处理、OCR转写、BM25页面检索和紧凑型视觉语言模型(VLM)提取四个步骤,有效解决了中小企业财务文档处理中的规模庞大、质量低下、多语言混杂和结构异构等问题。该框架采用8B参数的miniCPM-o 2.6模型,结合BM25检索算法,在保证准确率的同时显著降低了计算成本和延迟。实验表明,相比直接使用大型VLM,该方法在准确率提升8.8倍的同时,GPU成本降低到0.7%,延迟减少92.6%,为金融科技领域的文档智能处理提供了高效实用的解决方案。

2025-11-21 16:14:39 1588

原创 MonkeyOCR v1.5:解锁复杂文档解析的鲁棒性

1. 简化而高效的两阶段Pipeline: ○ 将复杂的多阶段流水线简化为两阶段 ○ 通过VLM联合预测布局和阅读顺序,增强视觉-结构一致性 ○ 在准确性和效率之间达到了新的平衡点2. 视觉一致性强化学习范式: ○ 首次系统性地应用GRPO算法于文档解析 ○ 提出"渲染-对比"机制作为奖励信号 ○ 显著减少了对大规模手工标注的依赖3. 复杂场景的系统性解决方案: ○ IDTP模块解决了表格内嵌图像问题 ○ TGTM模块实现了跨页/跨列表格的智能合并

2025-11-20 18:07:05 1035

原创 MosaicDoc:面向视觉丰富文档理解的大规模双语基准数据集深度解析

MosaicDoc数据集和DocWeaver流水线,解决了文档理解领域的关键挑战。针对现有数据集布局简单、语言单一、阅读顺序标注缺失等问题,MosaicDoc提供72,000+图像和620,000+双语问答对,专门针对报纸杂志等复杂布局文档。DocWeaver创新性地采用多智能体协作流水线,实现文档分解、复杂阅读顺序建模和高保真QA生成。核心技术包括HTML对齐方法、语义序列与布局层次混合策略,以及视觉中心流水线,有效处理了非线性布局、跨页关联和多模态融合等难题。

2025-11-19 23:29:41 886

原创 基础数据结构之单调栈:下一个更大元素(LeetCode 496 简单题, LeetCode 503 中等题)、每日温度(LeetCode 739 中等题)

单调栈应用总结 这三道题目均利用单调栈解决元素右侧更大值的问题,核心思路是维护一个单调递减栈,通过比较栈顶元素与当前元素来确定下一个更大元素。 LeetCode 496:通过反向遍历nums2构建单调栈,记录每个元素的下一个更大元素,最后映射到nums1。 LeetCode 503:处理循环数组时,使用虚拟双数组和取余操作,通过反向遍历维护单调栈,解决循环查找问题。 LeetCode 739:正向遍历温度数组,利用单调栈记录未找到更高温度的日期索引,计算天数差作为答案。

2025-11-18 20:04:31 259

原创 SQLBot智能问数系统深度解析:基于RAG的Text-to-SQL技术全景剖析

Text-to-SQL技术发展经历了从规则驱动到神经网络再到大型语言模型的演进过程,但当前仍面临模式理解、语义歧义和跨域泛化等挑战。SQLBot作为开源项目,通过检索增强生成(RAG)技术结合prompt工程,提供了轻量级智能问数解决方案。其核心流程包括问题预处理、数据源选择、模式检索与SQL生成四阶段,支持多种数据库并采用自定义M-Schema格式表示模式。该系统设计简洁,强调prompt驱动而非模型微调,具备开箱即用和可视化集成特点,为解决Text-to-SQL实际应用难题提供了新思路。

2025-11-17 21:45:50 1165 1

原创 基础数据结构之栈的经典题目:括号匹配(有效的括号 LeetCode 20 简单题)、最小栈(LeetCode 155 中等题)、逆波兰表达式求值(LeetCode 150 中等题)

这三道LeetCode题目都涉及栈的应用: 括号匹配:使用栈检查括号的有效性,左括号入栈,右括号与栈顶匹配,最后栈空则有效。 最小栈:设计支持O(1)获取最小值的栈结构,使用辅助栈同步存储最小值。 逆波兰表达式求值:利用栈计算后缀表达式,遇到运算符就弹出两个操作数运算后将结果压回栈中。 共同点在于都利用了栈的后进先出特性,分别解决了括号匹配、最小值和表达式计算问题。解题时都需要注意边界条件处理,如空栈判断和特殊输入情况。

2025-11-17 21:07:40 443

原创 RAG系统中的文档解析挑战

本文探讨了RAG系统中文档解析的关键性及技术演进。文档解析将非结构化文档转换为机器可理解格式,是RAG性能的基础。传统管道式架构模块化强但存在误差累积问题,而新兴视觉语言模型(VLM)虽能端到端解析却面临幻觉和计算成本挑战。文章重点分析了表格识别的多维挑战(如误检测、结构复杂性)及解决方案,包括多模态验证、后处理筛查和专用模型应用。混合架构结合了传统方法与VLM优势,成为当前主流趋势。文档解析质量直接影响RAG系统效果,需根据应用场景权衡准确性、效率与成本。

2025-11-17 00:30:28 1315

原创 query加强之深度解析ReDI:通过分解与解释增强query理解的推理方法

ReDI论文的主要贡献可以概括为:1. 理论贡献:证明了对于复杂查询,分解仍然是有效的方法,但需要配合解释来提升检索性能2. 方法创新:设计了三阶段pipeline(分解-解释-融合),针对稀疏和稠密检索定制化解释策略3. 数据资源:构建并开源了3403条真正需要多源推理的复杂查询数据集Coin4. 实用价值:通过知识蒸馏实现了生产级部署,使用8B模型达到或超越671B模型的性能

2025-11-16 21:36:34 711

原创 GraphSearch:图检索增强的深度搜索工作流

本文深入解读GraphSearch论文,提出了一种基于智能体的深度搜索工作流,显著提升了GraphRAG系统处理复杂查询的能力。GraphSearch通过模块化深度搜索管道(包含查询分解、上下文精炼等6个核心模块)和双通道检索策略,实现了多轮迭代和反思推理。该系统可无缝集成现有GraphRAG框架,在6个多跳QA基准上表现优异。论文详细剖析了技术背景、核心机制和实验验证,指出其计算成本和提示词依赖等局限,同时强调其即插即用的特性和作为GraphRAG发展方向的重要性,为知识密集型应用提供了实用解决方案。

2025-11-15 15:49:24 1300

原创 Doc-Researcher: 多模态文档深度研究系统的技术解析

系统通过深度多模态解析保留文档的视觉语义信息,支持跨模态和多粒度自适应检索,并采用迭代多智能体工作流进行深度研究。系统采用离线-在线架构,离线阶段解析文档为多粒度表示,在线阶段通过PlannerAgent分解查询,SearcherAgent执行多模态检索,RefinerAgent精炼证据。

2025-11-12 22:41:25 1199 2

原创 基础数据结构之链表的链表排序:排序链表(归并排序)(LeetCode 148 中等题)

本文提供了两种Python解法(递归法和迭代法)来对链表进行升序排序。递归法通过快慢指针找到中点分割链表,分别排序后合并;迭代法则通过计算链表长度,分步合并相邻子链表。两种方法都调用了相同的merge函数来合并有序链表,并注意在类方法中使用self关键字调用。代码实现完整,边界处理完善,适用于链表排序问题。

2025-11-11 10:31:40 190

原创 基础数据结构之链表的合并链表:合并两个有序链表(LeetCode 21 简单题)

摘要: 该算法实现将两个升序链表合并为一个新的升序链表。通过使用哨兵节点处理边界情况,通过双指针遍历比较节点值,将较小值依次链接到新链表中。当任一链表遍历完成后,将剩余节点直接链接到新链表末尾。时间复杂度为O(m+n),空间复杂度为O(1)。该解法简洁高效,适用于链表合并问题。

2025-11-10 10:39:25 210

原创 SmartResume简历信息抽取框架深度解析

摘要 本研究提出一种融合版面分析与高效大语言模型的简历解析框架,解决文档异构性、LLM高成本和评估标准化三大挑战。系统采用混合PDF解析与YOLOv10版面检测,将复杂布局转换为带行号索引的线性文本流。创新性地使用任务分解与索引指针机制,配合微调Qwen3-0.6B模型,在保持高准确率的同时显著降低延迟。通过两阶段自动评估协议实现细粒度性能度量,为工业级部署提供可靠支持。该方法已成功应用于阿里巴巴HR平台,实现实时高效的简历结构化处理。

2025-11-09 23:47:34 1223

原创 基础数据结构之链表的反转链表:反转链表的一部分(LeetCode 92 中等题)

摘要:本文提出了一个反转单链表指定区间节点的算法。使用哨兵节点处理头节点反转的特殊情况,通过找到区间前驱节点后,采用头插法将区间内节点逐步移动到前面实现反转。算法通过维护pre、start和then三个指针,每次操作将then节点插入到区间起始位置,确保不断链。时间复杂度O(n),空间复杂度O(1)。

2025-11-09 11:15:42 169

原创 FastAPI深度解析

FastAPI 是一个快速崛起的 Python Web 框架,基于 Starlette(ASGI) 和 Pydantic 构建,具有出色的性能和开发效率。其核心优势包括:1) 采用分层架构实现关注点分离;2) 内置依赖注入系统提升代码复用和测试性;3) 严格遵循 OpenAPI 标准自动生成文档;4) 充分利用 Python 类型提示实现类型安全。Benchmark 显示 FastAPI 性能接近 Node.js 和 Go 框架,同时保持 Python 的开发便利性,使其成为现代 Web 开发的理想选择。

2025-11-06 20:35:40 541

原创 基础数据结构之链表的反转链表:反转整个链表(leecode 206题 简单题)

摘要: 本文介绍了反转单链表的算法实现,通过逐步修改节点指针方向完成反转。使用pre和curr两个指针,pre初始为空,curr从头节点开始遍历。每次迭代保存curr.next到临时变量,修改curr.next指向pre,然后移动pre和curr指针。当curr为None时,pre即为新链表的头节点。该算法时间复杂度O(n),空间复杂度O(1)。关键点在于利用临时变量防止断链,通过指针重定向实现反转。

2025-11-06 12:03:14 117

原创 基础数据结构之数组的矩阵遍历:螺旋矩阵(LeetCode 54 中等题)

摘要: 本文介绍了如何按顺时针螺旋顺序遍历二维矩阵元素。通过设定上下左右边界并逐步缩小范围,依次处理矩阵的外层到内层。关键点在于边界条件的处理:当矩阵为空时直接返回;在遍历最后一行或一列时需防止重复访问。核心算法使用四步循环(右→下→左→上)并按边界调整方向,保证所有元素被有序访问。时间复杂度为O(mn),空间复杂度为O(1)。

2025-11-06 10:49:22 182

原创 基础数据结构之数组的滑动窗口(双指针特殊应用):无重复字符的最长子串(LeetCode 3 中等题)

摘要:本文介绍如何找出字符串中最长无重复字符子串的长度。采用滑动窗口法,用左右指针遍历字符串,右指针扩展窗口,左指针确保窗口内字符不重复。使用字典记录字符位置,当遇到重复字符且在窗口内时,移动左指针到重复字符后。始终更新字典并记录最大窗口长度。时间复杂度O(n),空间复杂度O(min(m,n)),其中m为字符集大小。

2025-11-06 09:39:26 104

原创 基础数据结构之数组的前缀和技巧:和为K的子数组(LeetCode 560 中等题)

摘要:本文介绍了使用前缀和技巧解决子数组和为k的问题。通过构建前缀和数组并利用哈希表记录各前缀和出现次数,可以在O(n)时间复杂度内高效统计符合条件的子数组个数。文中对比了暴力解法和优化解法,重点解释了前缀和与哈希表结合的原理:当当前前缀和与k的差值存在于哈希表时,即找到满足条件的子数组。初始哈希表需预存{0:1}以处理首个元素符合条件的情况。

2025-11-05 23:49:17 328

原创 基础数据结构之数组的双指针技巧之快慢指针(同向移动):移动零(LeetCode 283 简单题)

摘要: 本文提出了一种双指针方法,将数组中的所有0移动到末尾并保持非零元素顺序。使用快指针遍历数组,慢指针记录非零元素位置。快指针遇到非零元素时,将其复制到慢指针位置,随后慢指针右移。遍历完成后,将慢指针后的所有元素置零。算法时间复杂度O(n),空间复杂度O(1),实现了原地操作。

2025-11-05 20:40:07 125

原创 基础数据结构之数组的双指针技巧之对撞指针(两端向中间):三数之和(LeetCode 15 中等题)

本文提出了一种解决三数之和问题的双指针算法。首先对数组排序以避免重复结果,然后固定一个数作为基准,使用双指针(头尾指针)法寻找另外两个数。通过比较三数之和与0的大小关系,动态调整指针位置:和小于0则右移左指针,和大于0则左移右指针。在过程中需要注意跳过重复元素以确保结果唯一性。该算法的时间复杂度为O(n^2),相比暴力解法的O(n^3)更高效,同时通过排序预处理确保了结果不重复。

2025-11-05 19:57:43 235

原创 基础数据结构之哈希表:两数之和(LeetCode 1 简单题)

LeetCode第一题"两数之和"展示了哈希表的经典应用。题目要求在整数数组中找到和为target的两个数并返回下标。暴力解法通过两层循环实现,时间复杂度为O(n²)。更优的哈希表解法时间复杂度为O(n),通过一次遍历并使用字典记录已访问元素及其下标,检查当前元素是否与字典中的补数匹配即可快速找到结果。哈希表方法显著提升了效率,是典型的以空间换时间策略的实现。

2025-11-05 17:21:36 277

原创 算法题种类与解题思路全面指南:基于LeetCode Hot 100与牛客Top 101

本文系统梳理了算法题的核心类型与解题思路,重点分析了LeetCode Hot 100和牛客Top 101高频题目。主要内容包括:1)算法复杂度分析基础,介绍时间/空间复杂度及其典型算法;2)高频题目题型分布统计,显示数据结构类(数组、链表、树)和核心算法(动态规划、回溯)占主导;3)详细讲解数组类题目的双指针、前缀和、滑动窗口等解题技巧,以及链表、二叉树等数据结构的常见题型和解法框架。文章为算法刷题提供系统性指导,帮助读者掌握高频考点和核心解题思路。

2025-11-05 14:51:04 1675

原创 RAG论文详细解读:《检索增强生成(RAG)系统综述:技术、指标与挑战》

这篇论文对检索增强生成(RAG)系统进行了全面综述,分析了2020-2025年间的128篇高引研究。RAG结合外部检索与生成模型,能显著减少大语言模型的"幻觉"问题,在医疗、法律等高精度领域应用广泛。研究发现:RAG技术呈现加速增长态势,主要应用于知识密集型任务和开放域问答;文档拆分(chunking)策略因领域而异,检索机制从单一发展到混合模式;评估指标仍以传统NLP为主,缺乏统一标准。当前挑战包括检索质量、领域适配性和评估体系不足等问题。该综述为RAG技术发展提供了系统性参考。

2025-11-03 23:15:35 1765

原创 RAG离线索引之Embedding模型如何选型及评估?

本文系统探讨了Embedding模型选型及应用的关键维度。首先从语言支持、向量维度、模型规模、领域适配性和部署成本五个方面构建选型框架,重点分析不同维度对检索效果的影响。针对中文场景,对比了BGE系列、M3E和Qwen3等主流模型,指出BGE-large-zh在1024维度的均衡表现,以及Qwen3在高维长文本处理的优势。提出768维适合通用场景,1024维提升语义区分度的实践策略,并通过纺织行业案例验证模型升级和混合检索对专业术语召回率的提升效果。

2025-11-03 17:26:03 901

行人重识别近年来顶会论文和代码

包括2020CVPR,2021CVPR,2020ECCV,2019ICCV

2021-05-26

显著性检测近年来顶会论文和代码

2020年CVPR,2021CVPR,2019ICCV,2020ECCV

2021-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除