- 博客(48)
- 收藏
- 关注
原创 【LangChain1.0】第八阶段:文档处理工程(LangChain篇)
本文深入探讨了LangChain生态下的文档处理方案,针对RAG系统中的PDF处理痛点提供了系统解决方案。主要内容包括: PDF分类与工具选择:将PDF分为原生PDF、扫描PDF和混合PDF三类,并推荐相应处理工具(PyPDFLoader、PDFPlumberLoader、UnstructuredPDFLoader等) 性能对比:详细比较了主流PDF处理工具的速度、文本质量和表格支持等指标 OCR集成:针对扫描文档介绍了Tesseract和PaddleOCR的集成方法 高级功能:展示了表格提取、Unstru
2026-01-21 18:16:13
196
原创 【LangChain1.0】第七阶段:RAG高级篇 (LlamaIndex)
本文深入探讨了LlamaIndex在构建高级RAG系统中的关键技术,包括混合检索(BM25+向量检索)、查询优化、重排序和知识图谱集成等核心功能。重点介绍了如何实现BM25检索器、向量检索器及其混合使用,展示了元数据过滤和查询引擎集成等实用技巧。文章通过代码示例详细说明了从基础检索到高级混合检索的实现方法,为构建高效RAG系统提供了实用指导。
2026-01-21 18:14:34
401
原创 【LangChain1.0】第六阶段:RAG基础篇 (LlamaIndex)
本文介绍了LlamaIndex框架的核心概念与基础使用。LlamaIndex是专为RAG应用设计的框架,具有数据优先、模块化设计和LLM无关等特性。文章展示了5行代码实现完整RAG流程的示例,包括文档加载、索引创建和查询处理。详细讲解了核心组件(Document、Node、Index)的使用方法,以及文档加载器的配置选项。LlamaIndex提供开箱即用的RAG解决方案,支持多种数据源和索引类型,简化了检索增强生成应用的开发流程。
2026-01-20 15:39:17
303
原创 【LangChain1.0】第五阶段:RAG高级篇(高级检索与优化)
RAG高级检索与优化技术 本文探讨了RAG(检索增强生成)系统的高级优化方案,针对基础RAG在召回率、排序精度和复杂查询处理等方面的局限性,提出了多种改进方法: 混合检索技术:结合向量检索(语义理解)和全文检索(精确匹配),通过权重调优实现20-30%的性能提升 重排序技术:优化top-k结果排序,提高15-25%的检索精度 知识图谱RAG:利用结构化知识表示处理实体关系查询,性能提升达30-40% 前沿方案:包括Self-RAG、Corrective RAG等创新方法 文章详细介绍了LangChain实现
2026-01-20 11:28:48
825
原创 【LangChain1.0】第四阶段:RAG基础篇(LangChain篇)
本文介绍了LangChain RAG(检索增强生成)的基础概念与核心组件。RAG通过结合外部知识检索与生成模型,增强LLM的回答能力。主要内容包括:1) RAG面临的文档加载、智能分块、精确检索等核心挑战;2) LangChain RAG的灵活性、组合性、扩展性等优势;3) 四大核心组件:文档加载器(支持PDF/HTML/CSV等格式)、文本分割器(多种分块策略)、Embeddings(文本向量化)和向量存储(如Chroma、FAISS等)。文章提供了详细的代码示例,展示如何利用LangChain构建完整的
2026-01-19 11:54:26
716
原创 【LangChain1.0】第三阶段:从 Chain 到 Graph 的思维跃迁
LangGraph:从链式到图式的Agent思维跃迁 本文深入解析LangGraph架构及其在企业级应用中的价值。LangGraph基于Google Pregel图计算模型,采用BSP(批量同步并行)执行模式,通过State、Nodes和Edges三大支柱构建带状态、可循环的事件驱动系统。文章详细讲解了State的强类型定义与Reducer机制,特别是add_messages的Upsert逻辑,以及如何构建可控的ReAct循环Agent。最后介绍了Command API实现动态控制流和企业级特性,帮助开发者
2026-01-19 09:56:46
614
原创 【LangChain1.0】第二阶段:快速上手实战
本文是LangChain 1.0+版本的快速入门指南,重点介绍了构建Agent系统的核心概念。主要内容包括:1) LangChain 1.0引入的统一消息系统(HumanMessage、AIMessage、SystemMessage、ToolMessage)及其在对话流程中的应用;2) 创新的Content Blocks机制,支持跨Provider统一处理文本、工具调用、思考过程和多模态内容。文章通过代码示例展示了典型Agent对话流程和内容块的用法,帮助开发者快速上手构建AI助手系统。要求Python 3
2026-01-17 23:15:54
775
原创 【LangChain1.0】第一阶段:基础认知
在开始学习之前,请确保完成以下环境配置:2. 安装依赖3. 环境变量配置4. 依赖版本清单前置知识建议具备以下基础知识:应用层Deep Agents / LangGraph Projects编排层LangGraph链路层LangChain / LCEL监控层LangSmith外部资源Models / APIs / ToolsLangChain 生态系统目前已形成“多层协同”的架构体系,既可支持快速原型开发,也可支撑生产级 LLM 应用。整体结构如下:LangChain 专注于 链式逻辑与 A
2026-01-17 23:14:34
991
原创 LangGraph第四阶段:Agentic RAG (智能体化检索增强)
在 RAG(检索增强生成)的发展历程中,我们正在经历从 Naive RAG(简单向量检索)到 Advanced RAG(重排与切片优化),再到 Agentic RAG(智能体化检索)编排的范式转移。传统的 RAG 是被动的:无论问题简单还是复杂,它都走同样的检索路径。而 Agentic RAG 将 RAG 转变为一个主动的决策流,赋予了智能体“反思”、“纠错”和“多步规划”的能力。
2026-01-09 11:48:19
1386
原创 LangGraph第三阶段:深度解析 LangGraph 前沿智能体架构
本文深入探讨了多智能体协同系统的核心架构与工程实践。重点解析了LangGraph的状态总线模式,通过精细化字段治理实现智能体间高效信息同步,同时利用子图隔离机制保护关键信息不被污染。文章详细介绍了动态裁剪和状态摘要技术,有效解决上下文爆炸问题,降低Token消耗并提升模型指令遵循度。针对生产环境中的竞态条件问题,提出了基于Reducer的冲突处理方案,实现并行Agent输出的智能合并。这些前沿技术为构建工业化级智能体系统提供了关键解决方案。
2026-01-09 11:23:33
699
原创 LangGraph第二阶段:解析 LangGraph 的记忆与状态管理
摘要: LangGraph 通过状态机架构解决 AI 智能体的记忆管理问题,提供短期与长期记忆的工业级方案。State Reducers 实现增量状态更新,避免覆盖式更新的上下文断裂和并发冲突,支持自定义归约逻辑(如消息累加、日志窗口化)。持久化检查点(Checkpointing) 通过 thread_id 隔离多用户状态,支持故障恢复和异步长任务,并为人机协作提供中断与状态修改能力。长期记忆(Store) 通过命名空间和语义检索实现跨会话知识共享,支持用户画像沉淀和群体经验学习。这些机制共同构建了可追溯、
2026-01-08 10:55:07
742
原创 LangGraph第一阶段:核心哲学与基础 (Foundations)
本文探讨LangGraph框架的核心哲学与基础架构,重点分析其状态机思维如何解决传统DAG在处理反馈环时的局限性。文章通过对比线性链与状态机的实现方式,展示LangGraph在容错力和确定性控制方面的优势。核心内容围绕三大支柱展开:State(使用TypedDict定义数据契约)、Nodes(独立功能单元)和Edges(决策路由)。以ReAct模式下的电商客服为例,说明如何通过"思考-行动-反馈"闭环构建高可靠AI系统。最后提供了快速构建ReAct代理的代码示例,突显LangGraph在
2026-01-08 09:28:03
806
原创 RAG 第七阶段:从概率模型到工业级提示词工程
本文深入探讨了RAG系统生产落地的核心逻辑层优化策略。作者指出大模型本质是概率引擎而非逻辑引擎,Prompt的作用是通过结构化设计坍缩概率分布,解决"中间丢失"问题。文章提出了Markdown/JSON结构化、思维链(CoT)与组件链(CoC)等关键技术,并给出生产级Prompt模板示例。针对幻觉治理、长文本处理等挑战,提供了强制Grounding、多级拒答和精排优化等解决方案。最后建立了决策矩阵,指导开发者根据业务场景在准确率、延迟和成本间进行权衡,实现最优的RAG系统部署。
2026-01-07 11:04:31
979
原创 RAG 第六阶段:评估、监控与工业化 (工程落地篇)
本文探讨了RAG(检索增强生成)系统在工业落地阶段的核心挑战与解决方案。针对黑盒问题,提出通过Ragas框架解耦评估检索与生成质量;在成本控制方面,介绍语义缓存、模型分级路由和Prompt压缩等技术;性能优化上强调流式传输、异步并行和早停机制;最后针对稳定性问题,提出强制引用归因等防御措施。全文聚焦如何将实验性RAG系统转化为高可靠、低成本、低延迟的商业产品,提供了从评估到工程落地的全链路解决方案。
2026-01-07 09:34:42
871
原创 RAG 第五阶段:GraphRAG —— 核心算法深度剖析与全局认知 (前沿篇)
摘要: GraphRAG突破传统向量检索局限,通过构建知识图谱实现逻辑拓扑关联,解决语义碎片化、全局盲区及多跳断裂问题。微软方案采用分层社区检测(Leiden算法)和预生成报告,支持全局综述与精准多跳查询。相比传统RAG、RAPTOR等,GraphRAG在复杂场景(如法律、金融分析)中展现逻辑推导优势,但成本较高。工业实践建议混合检索路由优化效率,并利用Neo4j+LangChain实现自然语言图谱查询。GraphRAG将搜索升维为“调研”,成为非结构化数据处理的必选项。
2026-01-06 09:21:58
1038
原创 RAG 第四阶段:Agentic RAG 与智能工作流 (深度进阶篇)
Agentic RAG:从单向流水线到智能决策系统 传统RAG系统遵循固定流程,而Agentic RAG通过引入智能体机制实现了三大突破: 动态感知:采用视觉索引(ColPali)和多模态解析技术,避免传统OCR的语义丢失 自主决策:通过语义路由和自查询实现精准检索,结合元数据过滤消除噪声 质量闭环:创新性引入CRAG和Self-RAG机制,通过多轮评分和反思确保输出准确性 该系统将RAG从简单信息检索升级为具备自我修正能力的智能工作流,采用LangGraph构建有状态处理框架,显著提升了复杂查询的处理能力
2026-01-06 08:52:57
980
原创 RAG 第三阶段:检索优化与进阶算法 (性能篇)
本文探讨了RAG(检索增强生成)系统第三阶段的检索优化策略,旨在解决"搜不到"、"搜不准"和"搜不全"三大痛点。从五个维度展开:1)索引前的语义表示增强,包括上下文增强和延迟切分;2)检索架构进化,引入RAPTOR递归摘要树和GraphRAG图增强;3)查询变换技术如HyDE和多查询重写;4)工业级混合检索结合关键词与向量搜索;5)检索后处理采用重排序技术。文章还提供了避坑指南,强调成本控制、延迟优化和置信度过滤的重要性。这些方法共同提升了RAG系
2026-01-05 11:28:05
827
原创 RAG 第二阶段:数据工程 —— 视觉解析与语义重构
本文介绍了RAG(检索增强生成)第二阶段数据工程中的视觉解析与语义重构技术。传统PDF文本提取方式存在多栏排版、表格混乱和语义丢失等问题,而现代视觉解析结合CV与NLP技术,通过布局分析、公式表格提取和阅读顺序重建,将文档转换为结构化Markdown格式。文章对比了Docling、Marker等工业级工具,并详细阐述了语义切分、上下文压缩增强和延迟切分等高级切分技术。此外,还介绍了俄罗斯套娃嵌入和向量库选型策略,最后通过实战演示了基于Markdown的结构化RAG构建流程,为开发者提供了避坑指南。
2026-01-05 11:11:33
809
原创 RAG 第一阶段:前沿技术剖析与环境搭建
RAG(检索增强生成)技术已从简单的知识检索演变为复杂的动态知识合成架构。本文深入剖析RAG的核心价值与标准化流程,包括知识库构建(加载、切分、嵌入、存储)和问答生成(检索、生成)六个关键步骤。重点介绍了前沿技术如语义分块、混合搜索、重排序等优化方案,并提供了Python环境搭建指南和基于LangChain的高鲁棒性实现示例。文章强调RAG相比长文本模型的优势在于成本效率、动态更新和可解释性,同时指出开发者需注意向量搜索的局限性、分块大小的优化以及早期评估的重要性。
2026-01-04 22:36:07
837
原创 JVM 调优深度实战:从底层原理到生产排查全路径复盘
JVM 调优不仅仅是参数的堆砌,它是一场基于对底层原理深刻理解的“刑侦破案”。掌握了排查工具链(top -> jstack -> jstat -> jmap),你就拿到了打开高手大门的钥匙。
2026-01-02 10:58:56
1098
原创 后端负载均衡架构权威指南:原理、演进与生产级实现
后端负载均衡架构权威指南摘要 本文深入解析了现代负载均衡技术的核心原理、架构演进与生产级实现方案。主要内容包括: 负载均衡的演进:从简单的DNS轮询发展到硬件ADC、软件定义LB和云原生Service Mesh,负载均衡已成为分布式系统的基石。 核心架构模型: 四层(L4)负载均衡:基于五元组转发,高性能但功能有限 七层(L7)负载均衡:支持应用层协议解析,实现智能路由和安全防护 Linux内核级实现:详细讲解LVS的NAT、DR和TUN三种模式,重点分析DR模式的ARP抑制原理。 算法与数学原理:从基础轮
2026-01-02 10:40:26
768
原创 后端线上故障分析与实战避坑案例
《后端线上故障分析与实战避坑案例》摘要: 本文剖析了分布式系统中的典型故障场景,包括电商超卖、重复扣款等P0级事故。通过真实案例揭示了Spring事务与分布式锁的时序错位、读写非原子操作等隐藏风险,提出编程式事务边界控制、唯一索引防重等解决方案。同时对比分析了幂等性八大实现方案的适用场景与局限性,并探讨了容器环境下CPU资源调度的常见陷阱。为架构师提供了从代码层到基础设施层的全链路避坑指南,强调通过事务隔离、锁生命周期管理和资源配额控制构建反脆弱系统。
2025-12-31 16:12:00
1258
原创 生产级Prompt工程实战:基于四象限法则落地指南
摘要 本报告系统探讨了生产级Prompt工程的方法论与实践,基于"四象限法则"(Johari Window for AI)框架,将Prompt工程划分为四种典型场景。报告结合Dify平台的"蜂巢架构"和可视化编排能力,针对每个象限提出具体解决方案:第一象限采用KERNEL框架确保结构化输出;第二象限运用思维链(CoT)和引导式对话;第三象限部署RAG技术进行知识增强;第四象限通过Agent自主编排实现复杂任务规划。报告为AI架构师提供了一套从"Prompt编
2025-12-31 11:30:34
754
原创 角色扮演大模型(RP-LLM)的深度技术剖析与演进
本报告深入解构了角色扮演大模型(RP-LLM)从通用模型中分化出的技术路径。不同于追求效率的“助手”模型,RP-LLM 旨在构建具备“拟人化”与“沉浸感”的数字生命。本文涵盖本体论基础、数据炼金术、认知架构设计及高性能推理工程,结合网易、Baichuan、Stanford 等前沿案例,绘制了一幅从“文本生成”到“硅基生命”的演进全景图。
2025-12-17 10:14:22
794
原创 测试集数据泄露问题:解析数据泄露及其治理机制
在参数规模突破万亿的大模型时代,评估基准(Benchmarks)的客观性正面临前所未有的挑战。当“刷榜”成为常态,高分背后的“数据泄露”问题逐渐浮出水面。本文基于前沿研究报告,从机理、检测到工程实践,深度剖析大模型如何通过“记忆”而非“推理”获取高分,并为开发者提供构建可信评估体系的工程指南。
2025-12-17 10:12:28
898
原创 大型语言模型推理范式演进:从提示工程到思维算法
本文系统梳理了大型语言模型推理范式的演进路径,从基础的零样本/少样本提示到思维链(CoT)、思维树(ToT)等结构化推理方法。通过定义解析、流程图解和实战案例,详细展示了不同范式在客服工单分类、医疗数据提取、法律合规审查等场景的应用效果。特别探讨了CoT自洽性(CoT-SC)等提升推理稳定性的工业级策略,为开发者提供了激发大模型复杂推理能力的实用指南。研究证明,合理的提示工程能显著提升模型在专业领域的逻辑推理和任务执行能力。
2025-12-16 09:54:22
1024
原创 Vue 3 前端工程化:架构、核心原理与生产实践
Vue 3 前端工程化实践摘要 本报告聚焦 Vue 3 全栈开发体系,深入探讨现代前端工程化实践。重点内容包括: 架构设计:采用 pnpm 包管理器优化依赖管理,推荐 Feature-Sliced Design (FSD) 架构模式提升代码内聚性,通过模块化结构解决大型项目维护难题 构建优化:基于 Vite 深度配置生产环境,集成自动化导入、代码压缩和可视化分析工具,实现高效构建流程 状态管理:运用 Composition API 和 Pinia 管理复杂业务状态,构建可维护的应用逻辑 实战案例:以电商后台
2025-12-16 09:51:36
975
原创 深度解析 Angular:掌握组件、路由、RxJS 与工程化的融合之道
Angular v17+ 深度解析:现代组件化开发与工程实践 本文全面剖析现代Angular(v17+)的核心特性与技术架构。重点内容包括:1)Angular的演进与优势,对比React/Vue的"开箱即用"特性;2)新特性如独立组件(Standalone)、Signals响应式系统和改进的控制流语法;3)工程化实践,涵盖CLI工具链、项目结构和开发流程;4)组件化开发详解,包括生命周期、数据通信模式等。文章采用TypeScript强类型风格,强调现代Angular的性能优化和开发体验提
2025-12-15 14:30:42
873
1
原创 检索增强生成 (RAG) :从数据解析到代理式架构的深度工程实践
检索增强生成(RAG)技术实现了大语言模型从静态知识库到动态智能体的转变,成为企业级AI应用的核心架构。报告深度剖析了RAG的技术演进:从朴素RAG的线性流程到高级RAG的预检索/后检索优化,再到模块化RAG的灵活编排,最终发展为具备自主决策能力的代理式RAG。同时指出了生产环境中的四大挑战:非结构化数据解析、检索语义偏差、高质量负样本缺失和生成幻觉问题。在数据处理方面,重点介绍了PDF解析的视觉检测与坐标排序技术,通过布局分析和分栏处理解决文档语义完整性难题。报告为架构师提供了从理论到实践的全面指导。
2025-12-15 14:29:33
1338
原创 超越 RAG: 构建具备“自我进化”能力的 Agentic Memory 系统
检索增强生成(RAG)让 AI 拥有了“图书馆”,可以查阅资料;而 Agentic Memory(代理记忆) 则赋予了 AI “海马体”,让它拥有了长期记忆、行为习惯和自我进化的能力。
2025-11-28 10:51:06
656
原创 Java 转 Python 速成指南:Java 视角下常用的 Python 特性
本文为Java开发者提供了快速掌握Python高阶特性的指南,重点针对LLM业务场景。主要内容包括:1)使用Pydantic进行数据校验和结构化(类似Java的POJO);2)利用Asyncio处理IO密集型并发任务(替代Java线程池);3)通过Generators实现流式响应处理;4)使用装饰器实现AOP切面编程(如API自动重试)。文章采用Java与Python对比的方式,帮助开发者快速理解Python在大模型开发中的最佳实践,如异步编程、类型注解和装饰器等核心特性。
2025-11-27 17:25:49
624
原创 深度解析 LlamaIndex:架构原理、RAG 范式演进与生产级落地全指南
本文深入探讨 LlamaIndex 作为“数据框架”的核心价值,剖析其从数据摄入到高级检索的完整链路,对比其与 LangChain 的架构差异,并提供 2025 年视角的生产环境选型与避坑指南。
2025-11-27 16:03:11
1013
原创 智慧园区业务架构深度解析:本地化部署与云边端协同模式
摘要: 智慧园区业务架构正从“云端集中式”向“云边端协同”模式转型,以解决传统架构在带宽、时延、可靠性和数据安全方面的瓶颈。边缘计算(尤其是“厚边缘”模式)成为核心,通过本地闭环实现毫秒级响应和离线生存能力。云端负责全局管理与分析,边缘节点处理实时决策与异构协议融合,终端设备则执行感知与控制。关键技术包括MQTT/QoS通信保障、本地存储选型(如Redis/SQLite)及离线数据同步机制(如Merkle Tree)。典型应用如视频监控的“按需拉流”和智慧停车的离线优先架构,显著优化带宽并提升业务连续性。
2025-11-26 16:26:06
1876
原创 Web架构解剖学:从 Vue 到 Spring Boot 再到 K8s 的全链路深度解析
本文深入解析现代Web全链路架构,从开发环境到生产环境的差异出发,揭示前后端分离架构中的核心组件及其作用。开发环境中,前端依赖Node.js开发服务器,后端使用内置Tomcat容器;而生产环境需要Nginx托管前端静态资源并解决SPA路由问题,同时作为反向代理连接后端服务。后端Nginx则负责动静分离、负载均衡等关键任务。文章通过架构图和配置示例,清晰展示了各组件如何协同工作,帮助开发者理解从代码到线上服务的完整链路。
2025-11-26 10:25:46
637
原创 统一语境前沿:模型语境协议 (MCP) 的综合架构分析及其在智能体系统中的战略必要性
摘要:模型语境协议(MCP)为AI智能体系统提供标准化接口,解决传统函数调用的碎片化问题。MCP采用客户端-主机-服务器架构,通过资源、工具和提示三大原语实现被动语境标准化、主动执行封装和工作流优化。相比函数调用,MCP具有松散耦合、动态发现和安全隔离等优势,支持服务器端处理减少Token消耗,并支持采样、启发等高级智能体能力。该协议为构建下一代语境感知AI系统提供了关键架构基础,尤其适用于企业级复杂集成场景。
2025-11-25 11:29:42
848
原创 从“检索”到“认知”:基于 Agent 的 RAG 架构深度解析与生产实战
本文探讨了基于Agent的RAG架构如何突破传统RAG的局限性,实现从简单检索到认知推理的跃升。传统RAG面对复杂问题时存在检索粒度失效、推理能力缺失等痛点,而Agentic RAG通过三层架构(感知规划层、工具执行层、反思生成层)赋予系统思考能力。文章详细解析了Self-RAG、CRAG等进阶模式,并通过金融分析、编程助手等场景展示其优势。同时指出生产环境中的四大挑战:死循环、延迟爆炸、上下文污染和成本失控,并给出相应解决方案。这种架构使系统从"搜索引擎"进化为"答案引擎&q
2025-11-25 11:17:40
954
原创 深度解析:基于 RAG 与 LLM 的智能推荐系统架构设计
智能推荐系统架构设计:RAG与LLM的融合创新 本文深入解析了一套基于检索增强生成(RAG)和大语言模型(LLM)的智能推荐系统架构。该系统分为离线数据处理和在线推理两大流程:离线部分通过文档解析、规则提取和LLM特征工程构建知识库;在线部分则根据用户交互深度动态生成画像,结合向量检索实现个性化推荐。文章详细拆解了五个核心模块的设计思路,包括数据解析层、规则提取层、LLM特征工程层等,并提供了典型生产案例和工具栈建议。特别强调了LLM在特征工程中的关键作用,以及如何处理延迟等实际挑战。该架构通过融合传统推荐
2025-11-24 14:26:06
816
原创 WVP+ZLMediaKit流媒体实战:从园区千路接入到云端级联优化的全链路解析
本文深入解析了基于GB/T 28181协议的WVP+ZLMediaKit流媒体架构方案。该方案采用信令与媒体分离的设计理念,WVP负责SIP信令管理,ZLMediaKit处理视频流转发与协议转换。相比厂商SDK方案,该架构具有跨品牌兼容性强、Web支持友好等优势。针对千路并发场景,分析了网络带宽、CPU内存等关键瓶颈,并给出TCP被动模式等优化建议。在云边级联场景中,提出了按需拉流策略以降低流量成本。文章还揭示了时间戳异常等生产环境常见问题及解决方案,为大规模视频监控系统建设提供了实用参考。
2025-11-24 14:08:45
1422
2
原创 面向海量并发的云边端协同IoT架构研究:数据流向、网关内核与分布式状态管理
随着物联网(IoT)技术的飞速发展,连接规模已从简单的数万台设备跃升至数亿级海量并发。传统的单体架构已无法满足工业互联网、智慧城市及车联网等场景对低延迟、高可靠性及离线自治的严苛要求。“云-边-端”协同架构因此成为业界事实上的标准范式。本报告旨在对该架构进行详尽的技术解构,特别聚焦于华为IoTDA(IoT Device Access)、智能边缘平台(IEF)及EMQX等业界领先解决方案的架构设计。
2025-11-23 15:20:26
1160
原创 深度解析:AI 联网搜索(Search-based RAG)的生产级架构实践
本文深入探讨了AI联网搜索(Search-based RAG)的生产级架构实践。针对大语言模型的知识局限性,提出了一套包含广度检索、精度筛选、深度解析和知识增强的漏斗型解决方案。通过搜索引擎API获取初始结果后,利用语义评分筛选高相关URL,再通过爬虫和数据处理转换为模型友好的Markdown格式,最终结合RAG流程实现精准回答。文章详细拆解了各阶段技术实现,包括Cross-Encoder重排序、HTML清洗和Prompt组装等关键环节,并提供了实际案例说明。
2025-11-23 14:16:47
663
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅