自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2506)
  • 收藏
  • 关注

原创 面试官三问Function Calling和RAG区别在哪

面试官问你Function Calling的原理,你是不是也只说"调用外部工具"四个字?** 那跟没答一样。他真正想听的是——Function Calling不是调接口,它是Agent感知世界的通道。

2026-06-16 21:44:37 65

原创 你的下一个同事可能是AI:AI Agent产业链全景

2026年6月,Anthropic年化收入run-rate已逼近500亿美元,较2025年底的90亿美元增长了五倍。完成650亿美元H轮融资后,投后估值约9650亿美元,首次超过OpenAI。CEO Dario Amodei在近期万字访谈中却说了一句让所有人脊背发凉的话:"\*\*海啸已经能在地平线上看到了,可大多数人还在解释那只是光线的把戏。\*\*"资本市场用真金白银投了票:它看中的不是Claude比GPT更会聊天,而是一个更大的叙事——\*\*AI Agent将成为继SaaS之后,软件行业最大的范式迁

2026-06-16 21:43:22 119

原创 26k Star! Haystack:RAG进入2.0时代,让大模型真正读懂你的私有数据

你的RAG系统是不是也这样:向量数据库调来调去,分块策略试了十几种,但大模型回答问题时还是「幻觉」满天飞,数据明明在那里,就是检索不出来。

2026-06-16 21:42:20 119

原创 使用 LangChain 构建自定义的 Agent Harness

很多 Agent 原型跑起来很快:给模型一个系统提示词,接几把工具,再让它循环调用工具直到完成任务。第一轮演示通常没问题,到了真实业务里,问题会集中冒出来。

2026-06-16 21:39:45 51

原创 OpenRAG 生产级知识库架构实战:构建可治理、可扩展、可审计的企业级 RAG 平台

很多团队做 RAG,真正卡住的不是“大模型会不会回答”,而是知识库系统能不能长期稳定地接住企业文档、权限、并发、更新、审计与成本压力。 > OpenRAG 的价值,不是又一个“聊天 Demo”,而是把文档处理、检索基础设施、工作流编排和对外接入整合成一套更接近生产现实的 RAG 平台底座。

2026-06-16 21:38:55 225

原创 企业智能体落地实战:从0到1的完整路线图

2026年,企业AI智能体(Agent)已从概念验证迈入规模化落地阶段。本文基于真实项目经验,梳理一条可复制、可量化的落地路线图,帮助企业在6-8周内完成从0到1的闭环。

2026-06-15 21:05:37 183

原创 企业级 RAG 系统工程化实战:从“能回答”到“可交付、可治理、可扩展”

真正的企业级 RAG,不是把向量库、Embedding、LLM 串起来就结束了,而是要把检索质量、权限边界、索引生命周期、并发控制、成本治理、可观测与发布回滚统一纳入一套工程体系。

2026-06-15 21:04:20 290

原创 从零设计一个准生产级 LLM Agent:可靠性、上下文与恢复机制

ThinkingAgent 是一个轻量级,准生产就绪的LLM Agent 框架,支持多 LLM Provider、复杂任务编排、自动故障恢复和长任务断点续跑。**本文完整记录了我从0到1构建

2026-06-15 21:00:26 233

原创 一篇文章讲清楚 AI Agent 的核心概念:从 Token、Skill、RAG 到 MCP、SDD 和 Harness 工程

Agent 架构与基础训练机制Agent 是以大语言模型为大脑的计算实体,它突破了传统“文本生成”的被动模式,具备规划、记忆和工具调用三大核心能力。这种架构使其能够自主拆解复杂任务,通过循环执行和感知反馈,像人类员工一样实现从指令响应到任务闭环的跨越。

2026-06-15 20:58:29 153

原创 知识库分层编排:从 RAG 到 Agent-native Knowledge Context Layer

一、知识库的根本困境从一个知识库检索超级微服务高级skill开始的思考。

2026-06-15 20:57:35 313

原创 分享一下我的Agent 学习路线

最近有好多小伙伴私信问我怎么转 Agent,今天给大家特意整理了一下!(个人学习路线,仅分享。)

2026-06-15 10:53:35 225

原创 借鉴 Salesforce Agent Script:构建“混合模式”高可靠 AI Agent 的实战指南

在企业级 AI 落地过程中,架构师面临的最底层挑战是:大语言模型(LLM)的\*\*随机性(Probabilistic)与企业业务规则所需的确定性(Deterministic)\*\*之间的不可调和。

2026-06-14 10:45:00 181

原创 AI、Agent、MCP、Skill 到底啥关系?把 AI 当成一个人就懂了

最近我在准备 AI 科研课程,发现很多人卡在 Agent 上,表面是在纠结工具,实际是模型、工具、MCP、Skill、Agent 这些词的关系还没放对。

2026-06-14 10:45:00 227

原创 多Agent协作的7种模式:从顺序链到A2A协议,你该用哪种?

搭了个多Agent系统,三个Agent分工明确,跑起来一看——Agent A的输出Agent B没收到,Agent C等半天还没开始,编排器把简单任务拆成了5步,并行执行的结果没人合并。

2026-06-13 20:32:09 279

原创 Loop Engineering(Agent 闭环工程)

Loop Engineering(闭环工程)的本质,是将你从"手动投喂 Prompt 的人体 API"这一角色中**彻底剔除**。你转而设计一套能自动驱动工作流运转的底层系统。此处的"闭环(Loop)"可理解为一种**递归式目标**:你只需定义终态,AI 便会持续迭代直至收敛。它底层由 5 大核心组件构成,而 Claude Code 和 Codex 目前均已点亮这五块技能树。

2026-06-13 20:29:26 251

原创 多智能体协作:AI时代的分而治之

多智能体协作的本质是分而治之(Divide & Conquer),通过将复杂问题拆解为子问题,由专门智能体并行处理后合并结果,有效解决单体大模型的三大瓶颈:上下文长度限制(主流窗口200K-1M tokens)、能力边界局限(单一模型难以精通所有领域)、串行处理效率低下。

2026-06-12 22:21:07 192

原创 RAG应用的八种技术架构

RAG(Retrieval-Augmented Generation,检索增强生成)是一种通过整合外部知识检索来增强大语言模型(LLM)能力的技术,简而言之就是给LLM加了知识外挂,这个知识外挂可以是传统关系型数据库、向量数据库或图数据库。RAG的另外一个核心内容是提示词模板Prompt Template,最终是要将检索到的知识结合提示词一起发送给LLM来增强生成。

2026-06-12 22:19:54 176

原创 为什么大模型总是“答非所问“?一文读懂 RAG

上个月帮一个朋友调试他的公司内部 AI 助手。他问 GPT:"我们公司去年营收多少?"GPT 答得头头是道,数字精确到亿。他直接拿去给老板汇报,老板当场打脸——那个数字是编的。

2026-06-12 22:17:27 188

原创 土木本硕28天agent开发学习计划

土木本硕转码后端已经 1 年多了,马上要入职大厂做大模型相关业务,可 Agent 这块我还只是零散了解,一想到入职要跟不上节奏,直接慌到连夜搞了个学习计划!

2026-06-12 12:04:00 222

原创 2026 年 AI Agent 框架选型指南:10 大主流框架横评

AI Agent 框架多到让人眼花缭乱。LangChain、AutoGen、CrewAI、n8n……每个都说自己是"最佳选择"。这篇文章帮你理清思路:10 个框架各是什么定位,适合什么场景,怎么选。

2026-06-11 21:46:11 191

原创 收藏这篇就够了!LangChain+ RAG从0到1搭建 智能客服系统

全文干货纯手写,架构拆解、原理讲解、细节优化全部逐一打磨。项目从零手写开发,调试排错、逻辑优化、功能迭代耗费大量时间与精力。深知大家自学踩坑多、拼接代码难运行、资料零散难落地,因此整理了**完整可直接运行的全套源码

2026-06-11 21:44:50 207

原创 阿里面试官追问:“Memory 和 RAG 到底什么关系?说错一个就回去等通知。“ 我画了张图,他点了点头。

今天就把这个混淆点拆开讲。先说结论:**把 Memory 等同于 RAG 的人,今年阿里大概率都没要。** 这两个东西看起来都是"把外部信息塞进 context",但职责完全不同。说不清边界,面试时就会被一刀切掉。

2026-06-11 21:43:51 182

原创 Agentic RAG 自主决策检索系统深度实践:从单轮问答到生产级智能检索控制系统

对许多团队来说,RAG 的初始阶段目标仅仅是“让模型具备检索能力”;然而,当系统真正投入生产环境后,挑战会迅速演变为“让系统懂得该查什么、查几次、查哪里、何时停止、如何兜底、怎样审计”。 > 此时,你需要的已不再是一条简单的检索增强问答链路,而是一套集规划、执行、反思、治理与可观测能力于一体的 Agentic RAG 系统。

2026-06-11 21:42:49 376

原创 OpenClaw、Hermes Agent、OpenHuman 横向对比:三个开源 Agent 到底适合谁?

2026 年,开源 Agent 进入了一个很有意思的分叉阶段:有的项目强调“让 AI 真正替你做事”,有的强调“长期自我成长”,还有的强调“先理解人,再开始行动”。

2026-06-11 21:34:38 250

原创 用Hermes Agent建立个人LLM Wiki知识库

2026年,AI 工具爆发,但很多人的知识管理还停在 Notion 笔记时代——标签一堆、页面一堆,真到要找某个知识点时,翻半天也翻不出来。

2026-06-10 20:59:59 181

原创 Agent 可观测性:为什么有了 LangChain,还会出现 Langfuse?

很久以前我就听说过 langsmith,它是 langchain 的商业化的可观察平台,我们虽然之前也对 LangChain 进行过研究,也有客户团队要求必须使用 LangChain,但我们自己还是习惯于手搓框架,所以对它并不关注,也没有想去了解它。

2026-06-10 20:59:01 154

原创 大模型只能说话,Agent 让它长出手脚做事

大模型能理解语言、能推理、能创作——但它只能输出文字。你让它查天气,它只能回复"我可以帮你查天气"。你让它发消息,它只能说"建议你这样写"。**它能给你建议,但留不下任何行动。

2026-06-10 20:52:46 204

原创 为什么现在 Agent 重新用回 Grep,而不是先做 RAG?

过去两年,做私有知识问答时,RAG 经常会成为那个默认答案:先建知识库,切 chunk,做 embedding,再把相关片段塞给模型。

2026-06-10 20:51:20 192

原创 大模型推理部署实战

这篇只聊线上推理真正绕不开的几件事:压测、PD 分离、长上下文、MoE、灰度、LoRA、KV Cache 量化和反馈闭环。

2026-06-10 20:50:17 238

原创 一文搞懂 RAG、GraphRAG、LlamaIndex:区别、场景与选型

在大模型落地私有知识库、智能问答、企业客服等场景时,**RAG、GraphRAG、LlamaIndex**是出镜率最高的三个名词。很多新手容易混淆:分不清谁是技术思路、谁是进阶方案、谁是开发工具。

2026-06-09 21:19:41 209

原创 从零训练一个小型语言模型

今天,我们就结合一份具体数据,完整走一遍从环境准备、数据处理、模型构建到模型训练的全过程,训练一个参数量约**0.1B,也就是1亿参数**的小型语言模型。

2026-06-09 21:18:34 149

原创 大模型后训练实战:微调和强化学习

如果把预训练(Pre-training)比作九年义务基础教育,那么后训练(Post-training)就是专项教育,像是本科、硕士和博士教育。

2026-06-09 21:15:49 283

原创 你的AI Agent三个月后就开始“胡说”——“养Agent”到底要花多少钱?

我去年帮一个客户做AI客服。上线第一个月,效果惊艳。80%的问题自动解决,客服团队从10人减到3人,老板很满意,在群里发了红包。

2026-06-09 21:12:32 197

原创 Code as Agent Harness:代码成为了Agent Harness的基础设施

核心创新**:首次提**Code as Agent Harness(代码即智能体承载框架)** 全新范式,推翻「代码只是LLM输出产物」传统认知,定义:**代码是AI Agent推理、行动、环境建模、执行验证、状态持久化的统一底层操作系统**。

2026-06-09 21:11:36 194

原创 企业 RAG 知识库落地,真正难的不是调用大模型

最近两年,似乎所有企业,都在追AI的风口,很多企业都在做 AI 知识库、智能客服、问答助手、文档助手、研发助手、运营助手、决策建议等。技术方案听上去似乎也都很统一:**把企业文档接入大模型,做一个 RAG 系统

2026-06-08 20:34:19 194

原创 Agent记忆系统:基于LangChain的Memory开发实战

上期咱们聊了记忆系统的设计思路——短期记忆、长期记忆、记忆巩固、记忆遗忘。理论讲了一圈,今天该动手了。本篇用 LangChain 的四种 Memory 模块,手把手搭一套真正能跑的对话记忆系统。零基础友好,代码可直接复制运行。

2026-06-08 20:29:59 189

原创 2026 主流 Agent 框架怎么选?

一句话:不存在"最好的框架"——LangGraph、OpenAI Agents SDK、CrewAI、Dify 分别代表四条完全不同的开发路线,选型的关键不是"谁更火",而是"你要解决什么问题"。

2026-06-08 20:27:12 237

原创 RAG 还在说“我信息不够“?谷歌Gemini这套 Agentic RAG 直接逼它接着搜

这篇文章要聊的,是谷歌新推出的一套 agentic RAG(智能体检索增强生成)框架。它由 Google Research 和 Google Cloud 联手打造,核心思路是:先把复杂的企业级问题拆开,然后一遍遍地去找上下文,确认信息够了,再动手生成答案。说白了,就是让模型别急着回答,先把上下文功课做扎实。

2026-06-08 20:26:14 232

原创 驾驭工程学:理解这一点将让你的AI智能体表现超过80%的其他智能体

关于智能AI系统为何在生产环境中仍然崩溃的不适真相——以及最终能解决这一问题的工程学科。

2026-06-08 20:23:34 233

原创 为什么我放弃了 OpenClaw,全面拥抱 Hermes Agent(上手指南)

作为一个带大模型后训练算法团队的 AI 工程师,我用 OpenClaw(龙虾)用了大半年,积累了不少记忆和技能。但当 Hermes 发布之后,我花了一个周末完成迁移,再也没回去。这篇是我上手Hermes 的完整记录——不只是迁移教程,更是从零理解 Hermes 三大核心机制(Memory / Skill / Nudge Engine)、安装、配置 GLM-5.1、以及我用它做工作记录、简历筛选、论文调研等六个真实场景的实战心得。

2026-06-07 20:41:51 318

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除