自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1962)
  • 收藏
  • 关注

原创 企业级AI智能体进化指南:Palantir Ontology与GraphRAG+OpenClaw深度融合(非常详细),这一篇含金量极高!

在最近的技术讨论中,有一个有趣的观点:Palantir的Ontology本质可以看作是GraphRAG图谱检索能力与OpenClaw智能体架构(消息路由、技能编排、可靠执行)的有机结合,但在企业级治理、动作能力和长期知识管理方面有更深层次的延伸。本文将深入探讨这一观点,分析Ontology、GraphRAG和OpenClaw各自的特点,以及它们的结合如何塑造企业级AI智能体的未来。

2026-03-20 22:19:45 202

原创 绝了,对标Coze、Dify的企业级的AI智能体平台,完美实现智能AI工作流系统。

这两天接了两个AI的项目,第一个做知识库然后可以AI提问,完美打造个人的AI知识库。

2026-03-20 22:18:07 202

原创 万表级数据库如何喂给Agent?一项关于格式、架构与模型能力的系统实验

当agent需要操作包含上万张表的企业级数据库时,应该如何组织上下文信息?是把完整schema塞进提示词,还是让agent自己通过文件工具检索?用YAML、JSON还是Markdown格式?这些看似基础的问题,此前缺乏系统性的实证研究。

2026-03-20 22:17:01 106

原创 软件被 Agent 重写:CLI 化的 SaaS,正在变成 AI 的“操作系统语言”

2023年以来,人工智能领域发生了一场深刻的变革,这场变革的核心不仅在于大语言模型的能力突破,更在于一个根本性的角色转变——软件的使用者正在从人类变成Agent。当ChatGPT Plugins首次展示了AI自主调用外部工具的可能性,当Claude的MCP协议让AI能够直接操作文件系统、数据库和API,一个清晰的趋势浮出水面:软件正在被重新定义,而这次重写的核心目标,是为AI Agent构建一套原生的交互语言。这不仅仅是技术层面的优化,更是软件工程范式的根本性转移,其影响力将深远地改变未来十年的软件架构设计

2026-03-20 22:15:23 110

原创 OpenClaw与RAGFlow深度融合实战(非常详细),运维知识图谱构建从入门到精通,收藏这一篇就够了!

本文介绍一种零侵入式知识库增强方案:在保留现有本地RAGFlow知识库的基础上,通过OpenClaw Skill封装RAGFlow API,实现检索结果的智能图谱化,让运维知识的检索精度随使用自动提升。

2026-03-20 22:14:19 255

原创 Streamlit+Qwen3.5构造多模态对话助手

本文介绍了一种基于本地的qwen3.5-9b、Z-Image-Turbo模型以及搜索功能的多模态对话助手实现方法。

2026-03-20 22:12:59 81

原创 AI Agent系统架构进阶指南:Agent Harness深度解析,从小白到大神,收藏这一篇就够了!

在今天的 AI Agent 讨论中,很多人关注的焦点几乎全部放在模型上:模型能力模型参数规模模型推理能力

2026-03-19 16:04:22 294

原创 AI Agent工程化落地教程(非常详细):从Demo到生产级,入门到精通,收藏这一篇就够了!

AI Agent 已经成为当前 AI 应用落地最热门的方向之一。但在真实企业环境中,一个令人警惕的数据是:超过 40% 的 Agent 项目最终失败。

2026-03-19 16:03:02 205

原创 超大规模进化策略 Evolution Strategies at the Hyperscale

进化策略(ES)(Rechenberg, 1978;Beyer, 1995;Beyer & Schwefel, 2002)是相对于基于梯度反向传播的一阶方法的一个有吸引力的替代方案,原因有几点。首先,ES 不需要可微性,因此可以优化更广泛的模型类别,例如具有离散参数化空间的模型(元胞自动机),并且可以优化梯度不可用或带有噪声的目标,如大语言模型微调中的仅结果奖励(Qiu et al., 2025)。其次,ES 对噪声和病态优化景观更具鲁棒性(Wierstra et al., 2011;Xue et al.,

2026-03-19 16:01:25 256

原创 从零构建MCP Server保姆级指南:协议原理深度剖析(含代码实战),看完这篇直接起飞!

过去一年,大模型真正的瓶颈已经不在「推理能力」,而在于:

2026-03-19 15:59:44 312

原创 浙大提出 SkillNet:构建可进化的 AI 技能网络

本工作提出 SkillNet,一个用于大规模创建、评估和组织 AI Agent 技能的开放基础设施,使智能体能够将零散经验转化为可复用、可组合的技能网络,从而持续提升能力。

2026-03-19 15:57:05 296

原创 机器学习求解流体方程被高估?Nature重磅揭秘真相(含金量极高),看完这篇少走3年弯路!

用机器学习加速求解流体相关偏微分方程(PDE)是当前计算物理领域的热门方向,这类研究普遍将传统数值解法作为基线对比,动辄宣称ML模型速度提升几十上百倍。但这些成果的真实性长期缺乏系统验证:会不会存在“田忌赛马”式的不公平对比?会不会效果不好的结果都被刻意隐瞒了?这些问题不仅会误导初学者的研究方向,还会让整个领域陷入“自嗨”式的无效产出,这也是这项研究要解决的核心痛点。

2026-03-19 15:55:10 290

原创 OPM 知识图谱动态化实战教程(非常详细),构建语义世界模型从入门到精通,收藏这一篇就够了!

在AI飞速迭代的今天,语义世界模型正从概念走向落地,成为具身智能、机器人、自动驾驶等领域的关键突破口。而要让语义世界模型真正实现“可推演、可解释、可规划”,一个核心难题始终困扰着技术圈:静态的知识图谱,如何变成动态的可运行世界?

2026-03-18 21:16:54 298

原创 Agent 时代的控制论:Harness Engineering 深度解析(深度硬核),从入门到精通,收藏这一篇就够了!

今年 2 月,OpenAI 发布了一篇文章 *Harness engineering: leveraging Codex in an agent-first world*,描述了一种新的工作方式:工程师不再直接编写代码,而是设计环境、制定规则,让 agent 在其中完成编码。

2026-03-18 21:11:08 309

原创 打造可靠的 LLM 检索触发器(深度硬核),语料库统计量方法全解析,收藏这一篇就够了!

本文提出QuCo-RAG框架,通过预训练语料库统计量而非模型内部信号来量化不确定性,解决动态检索增强生成中的幻觉问题。该方法在多跳问答任务上相比最优基线提升5-12个EM点,并可迁移至未公开训练数据的模型,为动态RAG建立了基于语料库验证的新范式。

2026-03-18 21:07:15 296

原创 Agent 探索不出新解法怎么办?(深度硬核),RL 策略提示调优全攻略,收藏这一篇就够了!

一个编程任务,基座模型尝试2048次也只有69%的概率碰到正确答案。标准RL训练后,模型的一次通过率卡在64%,连"多次碰运气"的上限都没突破。而论文提出的SGE(Strategy-Guided Exploration,策略引导探索)方法,把一次通过率推到了73%,真正让模型学会了基座版本根本做不到的事情。

2026-03-18 21:05:51 347

原创 打造超强知识 Agent:KARL 强化学习构建指南(保姆级教程),从入门到精通,收藏这一篇就够了!

一个基于GLM 4.5 Air微调的开源模型,在六项知识检索与推理任务上,以约三分之一的成本达到了Claude Opus 4.6同等水平的表现——这是Databricks最新发布的KARL系统交出的成绩单。在当前各家大模型厂商竞相堆叠参数和推理预算的背景下,KARL用强化学习证明了一条更经济的路径:与其让通用模型暴力搜索,不如教会模型高效地搜。

2026-03-18 21:01:41 299

原创 告别手动喂饭!Skill-Seekers 快速构建你的 AI 专属知识库

你是否也有这样的困扰:想让 Claude、Cursor 或者自己搭建的 RAG(检索增强生成)系统学习某个新框架,却发现官方文档结构复杂,或者代码仓库庞大?为了让 AI 能够“吃透”这些知识,我们往往需要花费大量时间去爬取网页、清理数据、编写 Prompt、拆分 Chunk……

2026-03-18 21:00:28 364

原创 大模型多轮对话质量衰减揭秘(非常详细),历史回复污染治理从入门到精通,收藏这一篇就够了!

和 AI 对话超过 20 轮之后,看着它慢慢开始胡说八道,如果有过这种经历,那么你就应该看看这篇论文

2026-03-17 22:10:21 163

原创 2026 年构建 RAG 系统的 11 个策略

为什么你的 RAG 系统会失败,以及如何通过结合这些技术来解决问题

2026-03-17 22:06:12 138

原创 神仙思路!普林斯顿提出OpenClaw-RL:Agent在线挨骂在线升级!

一句话概括,传统的强化学习只会给Agent打干瘪的标量分数,但这篇论文把用户的每一句吐槽都压榨成了保姆级的修正指令。通过巧妙的异步解耦,模型能一边服务用户,一边从下一步的真实反馈中算出哪些词该留、哪些词该删,彻底打通了从交互废料到模型权重的闭环。

2026-03-17 22:04:25 124

原创 从索引到生成,RAG 全流程解析!

RAG(检索增强生成)的主要驱动力在于 **LLM 预训练数据的局限性**。尽管 LLM 的预训练规模宏大,但它们无法包含用户的**私有数据**或预训练之后的**最新数据

2026-03-17 22:03:02 218

原创 港科提出 FLV-RL:让大模型“边想边验”的可证明推理框架

本工作提出 Formal Logic Verification(FLV)-guided Reasoning 框架,将形式化逻辑验证实时插入大模型推理过程,通过“自然语言思考 + 符号验证反馈 + 强化学习优化”的闭环机制,让模型在生成过程中主动纠错,实现更可靠、可证明的推理能力。

2026-03-17 22:01:40 237

原创 AI Agent基础|LangChain框架入门

LangChain是一个用于开发由语言模型驱动的应用程序的开源框架。它提供了一套工具和组件,使开发者能够轻松构建复杂的语言模型应用。

2026-03-17 21:57:17 293

原创 AI Agent多智能体架构教程(非常详细),三种协作模式开发从入门到精通,收藏这一篇就够了!

多智能体系统是 2026 年主流构建方式,Claude 的智能体团队功能、OpenAI 的 Swarm 框架、LangGraph 的编排层以及 CrewAI都指向同一个结论:复杂任务需要协调配合的专家,而非一个万能通才。

2026-03-17 21:45:36 362

原创 大模型选型与计费避坑指南(非常详细),Token上下文原理从入门到精通,收藏这一篇就够了!

想象你走进一家餐厅,菜单上写着"按食材重量计费"。你点了一碗面,但结账时发现:面条、汤底、葱花全都算重量,而且不同食材单价不同。大模型的 Token 计费,本质上就是这么回事。

2026-03-17 21:44:25 386

原创 AI Agent技能开发全攻略(非常详细),Agent Skills核心技术从入门到精通,收藏这一篇就够了!

最近一段时间,AI Agent 领域变化非常快。 从最早的 Prompt Engineering,到后来的 RAG,再到 MCP(Model Context Protocol),AI 的工程化能力正在迅速提升。很多开发者都在讨论一个问题:

2026-03-17 21:43:12 392

原创 多模态 Embedding 技术迭代:jina-clip-v2 的 CLIP 突破与 MLLM 范式对比

在多模态领域,CLIP模型早已成为跨模态检索的经典方案,但它“英语单语”“文本任务拉胯”“复杂视觉文档看不懂”的问题一直困扰着开发者。而Jina AI最新发表在2025 ICLR的jina-clip-v2,直接针对性解决了这些痛点——不仅支持89种语言,还能灵活调整嵌入维度,在文本检索、视觉文档理解等任务上全面升级。下面来深度了解下jina-clip-v2。

2026-03-16 10:20:06 324

原创 ProMem:让大模型 Agent 学会主动“反思”,提升长期记忆完整和准确性!

该文章提出了一种名为 ProMem 的主动式记忆提取框架,它模仿人类大脑的循环处理机制,通过“自问自答”的方式迭代验证和补全记忆,从根本上提升了 LLM Agent 长期记忆的完整性和准确性。

2026-03-16 10:18:24 338

原创 终于有人把AI Agent协议讲透了!2026最新生态全景解析,建议全文收藏!

伦敦国王学院团队提出 xMemory,用「先拆后聚」的层级记忆结构,把智能体长程对话的冗余检索砍掉 30% Token,QA 分数反而提升 10+ 点。

2026-03-16 10:16:52 317

原创 PDF 依然是 RAG 的“头号杀手”?:基于 Docling+隐形锚点的双模态 PDF-RAG深度实践

在企业知识管理中,PDF文档无疑是那颗明星。从技术手册到培训课件,从学术论文到产品规格书,PDF 承载着组织最宝贵的知识资产。然而,当我们将目光投向 RAG(Retrieval-Augmented Generation,检索增强生成)系统时,这颗明星却常常演变成一场噩梦。

2026-03-15 10:45:00 346

原创 Agent自我进化革命之作,别再搞单线优化了,最新群组进化范式!

一句话概括,AI不是野生动物,根本不需要搞生物界“生殖隔离”那一套。这篇论文直击痛点,废除了过去Agent自我进化时“单线繁衍、老死不相往来”的树状模式,直接把一群Agent的历史报错和成功代码丢进共享池让大家互相“抄作业”,从而用极低的成本自动迭代出了超越人类手写的Agent底层框架。

2026-03-14 20:48:46 381

原创 真不想打击做 AI agent 的小朋友,但我想说

我每天都能看到很多年轻的开发者,在兴奋地分享他们新做的AI Agent。热情很高,技术也不错。

2026-03-13 19:07:46 342

原创 AI进入封建时代:基于三省六部设计多agent

刷到一个有意思的项目,基于中国古代存在了 1400 年的“三省六部”制度设计 multi agent 协作架构。明太祖朱元璋废除的三省,在1400年之后赛博复活了。

2026-03-13 19:06:55 389

原创 LangChain快速入门实战指南(非常详细),多智能体架构设计从入门到精通,收藏这一篇就够了!

本文基于 Content Extraction 工具生成。该工具专为技术文档设计,利用智能爬虫与结构化生成技术,从海量文档中萃取核心知识点与关键路径,为您提供一份清晰、易记的智能体开发速查手册。

2026-03-13 19:06:02 364

原创 RAG 效果不好?90% 的人排查方向都错了

RAG 效果不好?90% 的人排查方向都错了> "2 年 RAG 开发经验,独立搭建过企业知识库,熟悉 Milvus、Elasticsearch 等主流向量数据库"

2026-03-12 22:13:16 16

原创 AI核心概念全解析深度教程(非常详细),AGI、AIGC从入门到精通,收藏这一篇就够了!

现在人们张口闭口都是AI、大模型……但是你真的分得清**AI、AGI、AIGC、大模型、智能体、具身智能**吗?本文数百字给你说清楚。

2026-03-12 22:12:06 87

原创 Harness Engineering核心理念解读(非常详细),软件工程变革从入门到精通,收藏这一篇就够了!

2026 年 2 月 11 日,OpenAI 在工程博客发布了一篇文章:Harness engineering: leveraging Codex in an agent-first world

2026-03-12 22:09:40 236

原创 从通用Agent到领域Agent:技术原理与演进路径

在基于大语言模型(LLM)的应用架构中,存在一个核心矛盾:LLM本身具备强大的通用推理能力,但缺乏对特定领域知识的精准掌握与执行能力。

2026-03-12 22:07:39 75

原创 Spring AI + RAG 从 0 到 1 落地:本地知识库 + 联网搜索,一套代码直接跑通

不用啃复杂理论,一句话说清:**RAG = 本地知识库检索 + AI 生成**核心流程:1. 把本地文档(PDF/Word)转成「向量」存到向量库(比如 Redis)2. 用户提问时,先把问题转成向量,去向量库找最相关的内容3. 把找到的内容 + 用户问题一起传给大模型4. 大模型基于“本地知识 + 自身能力”生成答案

2026-03-12 21:26:08 330

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除