- 博客(579)
- 收藏
- 关注
原创 聊一聊RAG 系统在大规模数据下的“语义崩塌”
这听起来挺玄乎,其实道理并不复杂。所谓的“语义崩塌”,就是当你把海量的文字转换成计算机能懂的一串串数字(也就是向量),在这个高维的数学空间里,这些数字原本应该像星星一样,意思相近的凑一块,意思远的离远点。但随着数据量越来越大,这些“星星”开始乱了套,大家挤在了一起,原本独特的语义特征消失了,系统再也分不清谁是谁,这就叫“语义崩塌”。(Semantic Collapse)
2026-03-18 21:13:45
480
原创 告别繁琐配置!OpenRAG保姆级教程:大模型RAG开发新选择,建议收藏
本文介绍了新晋RAG平台OpenRAG,它集成了Langflow、OpenSearch和Docling,主打“开箱即用”与可视化编排。文章深度对比了OpenRAG与LangChain、LlamaIndex、Haystack等主流框架,分析了其在Agentic RAG和混合搜索上的优势及局限。最后针对不同应用场景提供了具体的RAG框架选型建议,助你快速上手。
2026-03-18 21:13:14
688
原创 别再用传统RAG了!用LangGraph构建Agentic RAG,彻底解决幻觉
本文针对传统RAG检索质量差、无法纠错等痛点,阐述了Agentic RAG的Think-Act-Observe循环。通过LangGraph手把手构建具备自我反思、查询改写能力的智能检索系统,帮助开发者实现从被动执行到主动决策的跨越,打造高质量大模型应用。
2026-03-17 21:20:46
379
原创 RAG检索架构必知:双塔负责规模,单塔负责精度
文章深入解析了RAG系统中的双塔(Bi-Encoder)与单塔(Cross-Encoder)架构。双塔结构利用向量数据库实现海量数据的快速召回,但精度较低;单塔结构通过交叉注意力实现高精度排序,但计算成本高。两者结合的两阶段检索架构,兼顾了效率与精度,是构建高质量RAG系统的关键方案。
2026-03-17 21:20:09
326
原创 用Ollama在本地部署和使用大模型,小白程序员必备!收藏学习!
本文介绍了Ollama这一开源项目,它简化了在本地部署大语言模型(LLM)的过程,屏蔽了复杂的系统环境。Ollama提供了多种开源LLM模型及其权重、推理代码和微调脚本,让用户可以轻松运行和定制LLM。文章详细说明了在Mac设备上安装运行Ollama的步骤,并展示了如何通过客户端如open-webui与本地LLM进行交互。此外,还介绍了如何利用FreeGPT35项目在本地搭建ChatGPT 3.5的代理,实现免密钥访问OpenAI API。这些内容对于想要探索和定制LLM的开发者和研究人员来说,提供了一个便
2026-03-09 21:14:41
387
原创 大模型初探:收藏这份本地部署指南,小白也能轻松玩转DeepSeek!
本文介绍了如何使用开源工具ollama在本地部署DeepSeek大模型,并构建本地知识库结合联网搜索。文章详细讲解了ollama的下载、安装、运行方法,以及如何选择和下载适合自己电脑配置的DeepSeek模型。对于想要在本地体验大模型、降低使用门槛的程序员和爱好者,这是一份实用且易于理解的入门指南。
2026-03-09 21:13:50
394
原创 本地部署大模型:新手友好,数据安全,
本文介绍了本地部署大模型的核心优势,如数据隐私、零成本使用、离线可用和完全控制等。推荐使用LM Studio进行本地部署,它具有可视化界面,操作简单,适合新手快速上手。文章还提供了详细的安装、模型下载、启动和对话步骤,以及性能优化建议和常见问题解答。此外,还介绍了如何通过LM Studio调用本地模型的OpenAI兼容API接口,为AI应用开发提供灵活和经济的选择。
2026-02-27 18:56:49
440
原创 LangChain入门指南:轻松掌握大模型开发的魔法工具箱
本文为初学者详细介绍了LangChain框架,一个专为大型语言模型(LLM)设计的应用开发工具。内容涵盖了LangChain的基本概念、安装与配置、核心组件(模型、提示、内存、索引)以及实际应用场景。通过实例代码,读者将了解如何使用LangChain进行基本操作,从而构建基于LLM的应用程序。本教程旨在为AI领域的学习者提供坚实的基础,鼓励进一步探索和实践。
2026-02-27 18:55:58
287
原创 Agent Skills配置全攻略,让你的大模型Agent告别“智障“
本文详细介绍Agent Skills的配置方法,强调技能要精准描述、分层管理和保持关联性,避免"越多越好"的误区。通过销售数据分析助手的实战案例,展示如何设计单一技能和工作流,并提供技能描述技巧、参数示例和错误处理等实用建议。作者强调,好的Agent不在于技能数量,而在于精准使用和持续优化,这是一个需要不断迭代的过程。
2026-02-09 19:06:10
1186
原创 MemOS智能体记忆开源框架:从Graph图谱到LangChain集成完整教程
本文详细介绍了MemOS智能体记忆开源框架的Graph记忆图谱能力与LangChain集成实践。展示了如何基于MemOS构建带记忆能力的ChatBot,体验记忆图谱的自动重组功能,并通过Middleware机制将MemOS无缝集成到LangChain智能体中,实现长期记忆与知识积累。这种架构使AI Agent具备超越会话上下文的持久记忆能力,为个性化服务和复杂任务处理提供了强大支持。
2026-02-09 19:05:10
830
原创 LangChain多智能体(MAS)实战指南:5大核心模式解析与联网搜索案例落地
本文深入解析多智能体系统(MAS)及其在LangChain中的实现。文中详细介绍了Subagents、Handoffs、Skills、Router和Custom workflow五种核心模式。通过构建具备联网搜索功能的智能助手案例,对比展示了基于LangGraph工作流与主从智能体工具调用两种实现方式的代码细节与架构设计,为开发者提供从理论到落地的实战参考。
2026-02-07 10:50:34
541
原创 从智障到智能:Agent Skills配置完全指南
文章介绍了如何正确配置Agent Skills,使AI智能体更高效工作。强调技能配置应遵循三大原则:精准描述(避免模糊语言)、分层管理(便于调用)、建立关联(形成工作流)。通过具体案例展示技能配置实战过程,并提供详细描述、添加示例、完善错误处理等实用技巧。最后指出,配置Agent Skills是持续迭代过程,应精益求精而非贪多求全。
2026-02-07 10:49:11
560
原创 大模型技术详解:从入门到精通,一文掌握产业链与未来趋势
大模型是指超大规模参数神经网络,具有强大学习能力和泛化能力。中国大模型产业链分为基础层、模型层和应用层,商业化进程加速,广泛渗透金融、政府等领域。2023年市场规模增长率突破100%,预计2030年将超2200亿元。未来预测大模型、决策大模型和具身智能大模型将成为新风口,市场竞争激烈,互联网公司、AI公司、学术机构及专家团队四大派系各具优势。
2026-02-06 10:09:28
553
原创 下一代AI应用:从顾问到执行者的实战指南(附代码示例)
文章探讨了AI应用从"顾问"到"执行者"的范式转变,介绍了AI Workflow和AI Agent两种设计模式,并使用LangChain框架进行实践。通过实际案例展示了如何构建稳定的工作流和自主智能体,并讨论了混合架构和MCP协议在企业级应用中的价值。文章强调AI不应仅停留在问答阶段,而应落地为实际业务工具,解决工作中的实际问题。
2026-02-06 10:08:21
864
原创 RAG知识库质量优化评估与改进指南
文章详细介绍了RAG知识库的评估框架与优化方法。首先通过余弦相似度构建召回率、正确度和基于知识的评估指标,并与ragas框架进行对比分析。随后提出两大改进方向:提升召回能力(优化知识切片质量、调整embedding参数)和提升回答能力(使用更强模型、优化提示词)。强调了RAG知识库优化是一个系统性工程,需要从多维度进行持续改进。
2026-01-31 18:21:49
799
原创 上下文工程——优化大语言模型性能的关键技术
本文全面介绍了上下文工程的概念与实施方法。上下文工程是在恰当时间、以恰当形式将恰当信息提供给大语言模型(LLM)的艺术与科学。作者将LLM比作CPU,上下文窗口比作RAM,并详细阐述了六种上下文类型:指令、示例、知识、记忆、工具和护栏。文章将上下文工程分解为四个基本阶段:编写、选择、压缩和隔离上下文,通过精心设计上下文工程,可以显著提升AI智能体的性能和响应准确性。
2026-01-31 18:21:07
961
原创 智能体路由模式全解析:构建灵活应变的大模型系统
路由模式是智能体系统的动态决策机制,根据环境状态、用户输入或前序操作结果选择最优处理路径。文章详解其定义、价值、四种主流实现方式(基于LLM、嵌入、规则、机器学习)、典型应用场景、落地步骤及工具框架,帮助开发者构建从"固定流程"到"动态决策"的智能体系统,解决灵活性差、上下文感知弱、扩展性差等核心痛点。
2026-01-30 19:08:55
1222
原创 Agent Skills实战指南:零基础学会大模型能力扩展,效率提升10倍
Agent Skills是Anthropic推出的模块化能力插件标准,通过文件系统实现渐进式披露机制,按需加载AI能力。相比MCP,Skills大幅降低Token消耗并提升工具调用准确性。Skills将重复性专业流程封装,用户无需每次输入冗长提示词,而是像调用工具一样使用。社区已涌现大量开源Skills,使AI能力扩展门槛大幅降低,成为Agent领域又一重要标准实践。
2026-01-30 19:08:00
1370
1
原创 大模型多智能体架构全解析:四种模式对比、性能评估与应用场景
文章探讨了多智能体架构的选择与应用,指出随着应用规模扩大,单智能体在上下文管理和分布式开发方面面临限制。介绍了四种核心架构模式:子智能体(集中式编排)、技能(渐进式披露)、交接(状态驱动转换)和路由器(并行分发与综合),分析了各自的工作原理、适用场景及性能特征。强调应根据具体需求选择合适架构,从简单单智能体开始,仅在必要时升级到多智能体系统,以平衡性能与开发复杂度。
2026-01-29 18:48:14
1339
原创 AI Agent记忆系统完全指南:从入门到精通,解决LLM上下文限制的必备收藏
本文详细介绍了AI Agent记忆系统的概念、分类及实现架构,包括短期记忆的上下文工程策略(压缩、卸载、摘要)和长期记忆的技术架构(记录与检索流程)。文章对比了Google ADK、LangChain和AgentScope等主流框架的记忆系统实现,分析了行业发展趋势,并提供了Mem0等长期记忆组件的集成方案,为构建高效、个性化的AI Agent提供了技术指导。
2026-01-29 18:47:06
925
原创 2025年大语言模型完全指南:从入门到精通,五大主流模型详解与应用场景
文章介绍了大语言模型(LLM)的发展现状和未来趋势,对比了2025年五大主流模型(GPT系列、Gemini、Llama、Claude和国内模型)的特点、参数规模、应用场景等,分析了LLM的核心技术发展方向如长上下文理解、多模态融合等,并通过实际案例展示了LLM在科研、金融等领域的应用价值,同时也指出了当前面临的挑战和未来风险。
2026-01-28 17:55:16
950
原创 从不确定到可靠:智能体工程全面解析 | 2026年AI开发必读
智能体工程是将不确定的LLM系统转化为可靠生产级应用的工程化过程,包含交互、模型、推理、上下文等10大核心维度。它采用"边上线、边学习"的开发范式,通过构建-测试-部署-观测-优化的循环迭代,提高AI可控性和可预测性,使智能体从Demo阶段发展为可靠的生产级系统,解决不确定、幻觉、不可观测等工程挑战。
2026-01-28 17:54:30
621
原创 小白必看!一文彻底搞懂RAG检索增强生成技术
本文全面介绍了RAG(检索增强生成)技术,包括其定义、工作原理(检索和生成两个阶段)、优势(提高准确性、可靠性、降低成本等)以及挑战。文章详细讲解了RAG如何解决LLM的"幻觉"问题,介绍了主流开源实现方案(如LangChain、LlamaIndex等),并提供了代码示例,帮助读者构建RAG系统。RAG通过结合外部知识检索与LLM生成能力,为构建更准确、可靠的AI应用提供了强大解决方案。
2026-01-24 18:59:30
768
原创 一文读懂多模态RAG,突破大模型上下文限制的文档理解新范式
本文提出"多模态RAG"作为文档AI新范式,通过直接使用文档图像嵌入替代OCR文本,保留图表结构语义;设计图文双路径协同机制和分层检索体系,突破传统上下文窗口限制;分为封闭域(单文档内检索)和开放域(跨文档检索)两种应用场景,显著提升大模型对长文档的理解能力和跨页推理准确性,减少幻觉现象,成为文档理解领域的主流研究方向。
2026-01-24 18:58:37
612
原创 大模型基石:Transformer架构完整计算流程详解
文章详细解释了Transformer神经网络架构的原理和计算步骤。首先介绍了Transformer如何取代RNN解决序列建模问题,然后分步骤阐述了输入数据处理(Tokenization、Embedding、Positional Encoding)、Encoder结构(Multi-Head Attention、残差连接、Layer Normalization、Feed-Forward Network)、Decoder结构(Masked Multi-Head Self-Attention、Multi-Head
2026-01-22 18:43:17
800
原创 RAG不死,只是进化!2026年上下文工程师必备指南,建议收藏学习
RAG技术未死,而是从狂热走向冷静,将演变为"上下文工程"。GraphRAG、AgenticRAG等新技术存在成本高、稳定性问题,长上下文与RAG互补而非替代。2026年RAG将成为AI应用基础设施,智能体RAG、垂直领域RAG等趋势兴起。实际应用中,朴素的RAG配合高质量数据和精细产品设计往往比复杂方案更有效,开发者应从简单开始,持续迭代。
2026-01-22 18:42:07
707
原创 MCP入门指南:AI领域“万能插座“详解,程序员必学必收藏
本文详细介绍了MCP(模型上下文协议)是Anthropic公司推出的开放标准协议,旨在解决大模型与外部工具、数据源的交互问题。MCP采用client-host-server架构,通过标准化通信实现AI应用与多样化外部资源的连接。文章解释了MCP的工作原理、架构组件、与LLM的交互流程,并提供了创建MCP服务器的示例。MCP servers提供工具、资源和提示三种功能,可大幅简化AI应用开发,增强AI系统功能。
2026-01-14 16:00:15
828
原创 Claude Agent Skills 深度解析:原理、工作流与最佳实践
Claude 现已引入 Skills 功能,显著提升了其执行特定任务的能力。Skills 本质上是一个包含指令、脚本和资源的结构化文件夹,Claude 能够根据任务需求动态加载这些资源。这一机制的核心优势在于按需加载:Claude 仅在检测到当前任务与特定技能相关时才会调用该技能。这种设计不仅确保了 Claude 的运行效率,还能使其快速获取特定领域的专业知识,从而更高效地完成任务。
2026-01-14 15:59:10
955
原创 技术收藏:揭秘MCP如何让大模型从“云端囚徒“变为“世界掌控者“
MCP协议的标准化标志着AI从"脑力内卷"转向"基础设施交接",让大模型终于能连接物理世界。经历从只读到工具调用,再到感官流打通的三阶段进化,架构上大模型变为客户端,物理设备成为服务端。未来App将弱化为底层接口,交互路径进化为人→Agent→后端能力,让AI真正"理解"和接管物理世界,打破"屏幕边界"。
2026-01-13 15:18:11
516
原创 AI智能体(Agent)全解析+代码示例
本文全面介绍了AI智能体(Agent)的原理与实现,包括智能体的定义、特征与传统LLM应用的区别,以及构建智能体的三要素(模型、工具、指令)。文章详细讲解了智能体的编排模式(单智能体/多智能体系统)和护栏体系,并通过LangGraph框架提供了最小可运行智能体的代码示例。智能体的本质是执行任务而非简单对话,适合处理模糊性和上下文判断的场景。
2026-01-13 15:17:05
693
原创 质疑声层出不穷!Agent将何去何从?
早在2024年,我就预测了2025 年将会成为Agent 元年。2024年的“算力墙”问题已经出现了,模型效果边际收益递减,训练和运营成本高昂。在这样的时间节点和背景下,资本的眼光不可避免的会投入下一个AI 产品 —— 智能体(AI Agent)。这也是为什么会在开源中国的行业白皮书里写这样一篇文章。
2026-01-08 11:04:20
720
原创 AI的下半场:智能体(Agent)将如何重塑我们所有的应用?
过去两年,“AI智能体(AI Agent)”这个词频频出现在各种会议和论文中。有人说它是“下一个操作系统”,有人说它将“重塑所有应用”。但在喧嚣背后,真正懂智能体逻辑的人却不多。今天这篇文章,我们不讲空洞概念,而是带你从底层原理到落地实践,彻底弄清楚:* 智能体到底是什么?* 为什么现在是构建它的最好时机?* 如何一步步设计、编排和安全运行一个Agent?* 最后,我们还将用 **LangGraph 框架写一个可直接运行的最小智能体示例**。
2026-01-08 11:03:08
626
原创 Agent记忆 vs RAG:动态记忆与静态检索的终极对决
2025年AI记忆架构迎来关键转折,Agent记忆和RAG代表了上下文工程的两种根本路径。本文揭示二者在动态演化与静态检索、复杂推理与知识问答等核心维度的本质差异,并通过性能基准和工程实践帮助开发者精准选择技术方案。为什么复杂AI系统正从RAG转向Agent记忆?
2026-01-07 17:53:23
517
原创 大模型本地化部署及微调技术
本文来自“大模型本地化部署及微调”,重点分析大模型在垂直领域使用时为啥需要修改或增强,检索增强生成RAG和微调Fine-tunning选择,微调的种类和相关工具框架介绍,RAG、Fine-tunning微调时费用常见的估算方法,实际微调。
2026-01-07 17:51:03
712
原创 构建高质量AI智能体的10条核心法则:从理论到实战的完整指南
文章系统阐述了构建AI智能体的十大核心原则:拒绝为AI而AI、构建小巧解耦的系统、强制结构化输出、解释任务背景、优先编排而非完全自治、注重提示词工程、完善工具描述、实施缓存机制、使用共享产物以及全面记录。这些原则强调AI智能体构建不仅是算法选择,更是系统设计、工程架构和交互逻辑的深度思考,帮助开发者跨越概念验证到生产环境的鸿沟。
2025-12-31 18:13:53
838
原创 Plan-and-Execute 架构详解:从理论到实践
Plan-and-Execute 是一种将复杂任务先全局规划后执行的大模型架构模式,包含规划器、执行器和重规划器三大核心组件。相比传统 ReAct 模式,它具有全局视野、高效执行、支持并行、降低成本等优势,特别适合处理多步骤、长周期的复杂任务。通过先制定完整计划,再逐步执行并监控进度,必要时调整策略,使复杂任务变得有序可控。
2025-12-31 18:12:58
747
原创 智能体工程实践,让AI从“本地飞起“到“上线靠谱“
智能体工程是将不稳定的大模型系统转化为生产环境可靠应用的迭代过程,包含构建、测试、上线、观察、优化的循环。成功实施需要产品思维(制定规则)、工程能力(搭建基础设施)和数据科学(持续优化)三种能力配合。与传统软件开发不同,智能体工程将生产环境视为最佳学习场所,通过快速迭代和系统性优化,让AI系统能够处理复杂任务并创造真实商业价值。
2025-12-27 18:22:28
790
原创 提示词工程:与大模型高效对话的必备技能,程序员必学!
提示词工程是大模型应用的核心技术,是用户与大模型交流的桥梁。通过设计优化提示词,可充分释放大模型潜力。其关键在于将大模型视为智能助手,通过明确指令和上下文引导完成任务。提示词工程有ICIO等框架,依赖指示、上下文、例子、输入、输出五大要素,强调通过明确性、简洁性、不断优化提高输出质量,使大模型从工具转变为智能助手。
2025-12-27 18:21:30
746
原创 深度研究:我们如何构建水平最先进Agent
研究代理(Agent)正迅速成为人工智能最重要的应用之一。研究是一项基础性的知识工作:收集、阅读和综合信息是写作、决策乃至编程等一切活动的基础。然而,人类驱动的研究受到记忆力、阅读速度和时间的限制。相比之下,人工智能研究代理可以处理海量信息,即时综合洞见,并轻松扩展。正因如此,研究代理正成为当今人工智能的热门应用案例,并将很快成为内容生成、编程、销售等更广泛的代理工作流程的核心子组件。在本文中,我们将分享我们在构建最**先进的研究代理过程**中所汲取的技术和理念经验,以及我们对该领域未来发展方向的展望。
2025-12-23 15:38:29
971
原创 大模型训练算法宝典:6种主流算法对比与选择
文章对比了6种大模型训练中的强化学习算法:PPO、GRPO、GSPO、DAPO、BAPO和ARPO。分析了它们的核心特点、优缺点及适用场景,并给出2025年推荐指数。GRPO因节省显存成为大模型训练主流选择,GSPO在长文本生成和MoE模型训练中表现优异,DAPO和ARPO分别针对工程落地和AI Agent开发进行了优化,为不同场景的模型训练提供了多样化选择。
2025-12-23 15:37:23
1170
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅