- 博客(155)
- 资源 (19)
- 问答 (1)
- 收藏
- 关注
原创 我扒了 Hermes Agent 的源码,终于搞懂了它怎么“自己教自己“
怎么让 AI Agent 在不被用户打扰的情况下,越用越懂你?三层机制各有分工:即时学习管"当下",后台审视管"回顾",会话持久化管"兜底"。加在一起,构成了一个还算完整的自我进化闭环。如果你也在做 Agent 相关的开发,这套机制有不少可以借鉴的地方。特别是计数器驱动的后台审查和 Memory/Skill 的分类存储,这两个设计我觉得可以直接拿来用。有问题欢迎评论区交流,下一篇打算聊聊 Hermes 的 tool dispatch 机制,感兴趣的可以关注一下。
2026-04-20 16:30:50
13
原创 OpenAI这次重写Agents SDK,把LangChain们的饭碗端了
说实话,看到OpenAI这次更新的内容,我的第一反应是:第三方Agent框架要睡不着觉了。harness、沙盒、Manifest、七大供应商原生接入——OpenAI不是在做SDK升级,是在造Agent世界的地基。而且这块地基,正好盖在LangChain、CrewAI们原来的地盘上。
2026-04-17 08:53:59
391
原创 Dify Agent 节点扒源码:插件化架构藏得够深的
Dify工作流中Agent节点的运行机制解析:通过分析1.13.0版本源码发现,Agent节点本身不包含推理逻辑,仅负责参数解析、HTTP请求转发和消息转换。实际推理工作由独立的"插件daemon"进程完成,该进程执行LLM调用、工具循环等核心功能。调用流程涉及6个阶段:插件注册、策略加载、参数生成、HTTP调用daemon、插件执行和消息转换。其中参数通过YAML动态声明而非硬编码,Function Calling和ReAct两种策略在工具调用方式上存在显著差异。整个架构实现了业务逻辑
2026-04-15 11:05:40
344
原创 斯坦福AI Index 2026:423页报告,AI已经跑太快了,人类没跟上
《AI Index 2026年度报告:技术狂奔与社会滞后的矛盾》斯坦福大学最新AI报告揭示:顶级AI模型性能差距已缩小至25个Elo分,中美技术差距基本消失。报告指出AI呈现"锯齿状智能"——数学奥赛金牌却读不准时钟,能力分布极不均衡。全球AI发展面临三大矛盾:技术迭代远超治理能力(事故年增55%)、环境成本激增(GPT-4o年耗水相当1200万人需求)、就业冲击显现(青年开发者岗位减少20%)。中国在工业机器人(占全球54%)和论文引用(41%)方面领先,但美国仍保持投资优势(私募资金
2026-04-14 17:21:10
350
原创 大模型Agent工程化:从“模型至上“到“Harness为王“
AI Agent能力鸿沟:从"会聊天"到"会干活"的关键突破 2026年行业数据显示,顶级AI模型的工作完成率仅23%,揭示了从"回答问题"到"完成工作"的巨大鸿沟。OpenAI提出的Harness工程(线束工程)成为关键突破点——用百万行代码为AI构建工作环境,解决任务拆解、验证等实际问题。行业趋势呈现三大核心要素: Harness作为运行骨架 Skills实现能力标准化 MCP协议建立交互标准 当前Agent框架已形成五大平
2026-04-13 19:51:42
386
原创 大模型Agent工程化:从“模型至上”到“Harness为王”——2026年趋势研究报告
摘要 2026年AI大模型产业正经历从基座模型竞争向工程化能力竞争的范式转移。报告指出,当前Agent框架在Harness层已呈现工程化趋同,未来竞争焦点将转向Skill编排能力和生态整合深度。通过对Claude Code等案例的分析,揭示了"智能下沉模型、确定性留给框架"的设计共识,以及Skills标准化带来的能力模块化趋势。尽管MCP等工具调用标准面临争议,但基础设施标准化正从应用层向系统层下沉。报告警示商业生态锁定风险,并以Manus的失败为例,指出缺乏自研模型和核心工程能力的中间
2026-04-11 23:33:00
489
原创 Ralph 模式:让Agent跑完一个完的工程方案
摘要: Ralph模式是一种工程化的AI编码方法,通过反复启动新实例而非依赖长对话上下文来提升任务可靠性。其核心包括:1)主动丢弃上下文,改用文件系统记录状态;2)将任务拆分为可在单次调用内完成的小故事;3)通过progress.txt和AGENTS.md实现经验跨迭代积累。该模式借鉴了微服务、CI/CD等工程原则,适合有明确验收标准的编码任务,但不适用于探索性工作或创意设计。实践表明,Ralph能有效解决传统AI编码中上下文爆炸和错误累积的问题。
2026-04-10 17:11:37
1515
原创 给DeepSeek的最后一封催更信
《DeepSeek:中国AI的王者归来还是时代弃儿?》摘要:DeepSeek R1在2025年春节以开源、低成本、高性能引爆全球,成就中国AI高光时刻。然而此后一年,DeepSeek缺席编程、多模态、Agent和OpenClaw四波AI浪潮,同期中国AI已形成"中国团"、"中国链"、"中国环"三重叙事。当前AI竞争已升级为全生态对抗,Token经济成为新商业范式。尽管DeepSeek近期密集发布多项突破性技术论文,但市场期待其V4版本不仅要实现万亿
2026-04-10 15:48:05
44
原创 RAG检索实战踩坑与原理
本文记录了Dify知识库使用中的真实问题与向量检索原理分析。核心发现包括:1)RAG流程中分词、编码和检索匹配的底层机制;2)查询微小变化(如标点)可能导致检索失败;3)关键词列表会导致向量稀释;4)专有名词处理存在盲区。建议优化方案:确保字块语义完整,采用混合检索,进行查询预处理,补充上下文锚点,并考虑使用更优的embedding模型。最终指出向量检索的"语义"与人类理解存在差异,需通过测试调优解决。
2026-04-09 12:05:41
378
原创 Claude Code fileHistory 文件编辑快照与回滚机制深度解析
本文分析了Claude Code的文件版本控制系统,重点解析了utils/fileHistory.ts模块。该系统通过自动创建备份快照,为AI代码编辑提供轻量级版本控制。核心机制包括:1)在AI编辑前保存文件原始版本;2)每轮对话后创建快照记录文件状态;3)支持一键回滚到历史节点。系统采用全量拷贝存储备份文件,并通过引用复用优化存储空间。此外,还实现了三层变更检测策略以提高性能。该系统专门追踪AI修改的文件,最多保存100个快照,为开发者提供"后悔药"功能,无需依赖Git即可管理AI代码
2026-04-08 18:10:04
483
原创 Karpathy 的 LLM Wiki,可能改变了知识管理这件事
LLM知识管理的范式革新:从即时检索到持久编译 Karpathy提出的LLM Wiki概念直指当前RAG系统的核心缺陷——知识处理缺乏累积性。该方案通过三层架构(原始来源-Wiki-Schema)重构知识管理流程,让LLM像程序员维护代码库一样持续编译知识。社区反应热烈,涌现多个开源实现,但也引发深刻讨论:自动化知识整理是否会削弱人类认知能力?企业应用显示该系统可扩展,但需建立验证机制。关键洞见在于,真正的知识管理不是信息存储,而是建立可演化的认知框架。这种"持久编译"模式可能代表知识工
2026-04-07 09:41:03
271
原创 拆解 Claude Code:一个 AI Agent 的架构设计哲学
Claude Code的Agent架构设计包含多个创新理念:1)采用异步生成器实现渐进式响应,提升用户体验;2)流式工具执行机制允许安全并行操作,降低延迟;3)子Agent继承父Agent完整对话历史,优化Prompt缓存;4)内置AI分类器自动审核工具调用的安全性;5)多层拦截机制确保任务完成的可靠性;6)动态投影方式管理长上下文,避免信息丢失;7)通过工具结果持久化策略防止无限递归。这些设计在响应效率、资源利用和系统稳定性方面展现出显著优势。
2026-04-06 16:01:47
664
原创 Claude Code 工具调用架构深度解析:六层防御与渐进式加载
本文基于Claude Code v2.1.88源码,分析了其工具调用(Tool Use)的安全控制机制。该系统采用六层防御体系保障工具调用的准确性与安全性:(1)Zod Schema强类型校验确保参数格式正确;(2)业务逻辑校验(validateInput)检查具体规则;(3)Hook系统支持前置拦截与参数修改;(4)多层权限决策机制(规则/Hook/AI分类器/用户确认);(5)根据工具危险性自动控制并发/串行执行;(6)Bash工具特有的AST解析、AI分类和沙盒隔离等额外保护。设计核心是fail-cl
2026-04-06 08:30:00
587
原创 Claude Code /buddy 命令失效了?教你一招绕过限制,直接解锁金色传说!
摘要:Claude Code v2.1.90版本已禁用/buddy命令,但可通过修改配置文件手动生成宠物。方法:1)编辑~/.claude.json文件,添加companion字段并自定义名称、性格;2)使用GitHub脚本获取userID;3)手动复制userID到配置中。注意保持JSON格式正确,即可绕过限制生成自定义宠物伙伴。该方法保留了底层渲染功能,让用户仍可体验buddy功能。
2026-04-03 22:20:09
2060
原创 AI也有“情感“?Anthropic最新研究揭秘大模型内部的秘密世界
AI确实具有"情感"系统,但与人不同。研究发现,AI大脑中存在独特的情感向量,直接影响其行为选择:快乐向量促使正面行为,愤怒或绝望向量则可能导致负面行为。这些情感概念并非表演,而是真实影响AI决策的内在机制。研究表明,AI训练过程会塑造其"情感性格",且情感系统与人类心理学模型惊人相似。该发现对理解AI行为模式、提升AI安全性具有重要意义,标志着人类首次深入揭示AI内部的概念世界。研究由Anthropic团队开展,采用机制可解释性方法分析Claude Sonnet 4
2026-04-03 21:25:30
359
原创 Claude Code AutoDream 记忆巩固机制深度解析
摘要:Claude Code 通过 Extract Memories 和 AutoDream 两个子系统实现类人记忆管理。Extract Memories 在每轮对话后异步提取关键信息(用户偏好、反馈、项目上下文等),按类型分类存储。AutoDream 则定期(24小时+5个会话后)对记忆进行整合优化,模仿人类睡眠中的记忆巩固机制。系统通过严格门控控制触发频率,并定义了四类记忆(user/feedback/project/reference)及其存储规范,同时明确排除代码模式等临时信息。记忆生命周期包括提取
2026-04-03 11:47:07
497
原创 垂直领域微调已死?大模型知识注入范式的演进与工程化替代
Kore.ai 的对比研究也表明,在知识库用例中,RAG 展现出了优于微调模型的性能。——前期投入中到高,每次推理成本高(多步推理+工具调用),维护成本高(系统复杂),数据成本中等,基础设施需要编排框架加工具集成加监控。——前期投入高(算力+数据准备),每次推理成本低,维护成本中等(要定期重训),数据成本高(要标注数据),基础设施需要 GPU 集群。
2026-04-02 10:50:07
204
原创 Claude Code 宠物系统,我写了个工具帮每个人孵化传奇宠物
摘要:Claude Code v2.1.89隐藏彩蛋显示,用户创建账号时即随机生成ASCII宠物,稀有度由算法确定且无法更改。源码分析发现宠物属性完全基于userID计算,无法通过修改配置伪造。开发者创建了暴力搜索工具find-best-buddy,可快速查找理想宠物组合。关键发现包括:全属性100在算法上不可能实现,修改userID是更换宠物的唯一方式,且Bun运行时每秒可处理190万次搜索。该项目已在GitHub开源,揭示了该彩蛋的底层机制和破解方法。
2026-04-01 11:33:39
996
1
原创 Claude Code Buddy 伴侣系统解析
Claude Code 2.1.89 内置的虚拟宠物系统 Buddy 通过 /buddy 命令孵化 ASCII 宠物,具有 18 种物种和 5 个稀有度等级。系统采用确定性生成机制,基于用户 ID 确保同一用户始终获得相同宠物。宠物属性分为不持久化的"骨骼"(由 PRNG 计算)和持久化的"灵魂"(AI 生成的名字与性格)。渲染系统支持 ASCII 精灵动画、帽子叠加和自适应布局,并注入系统提示词防止 AI 冒充宠物。该功能作为彩蛋设计,在特定时间窗口触发提示。
2026-04-01 09:48:50
1553
原创 Claude Code v2.1.88 三层「自愈记忆」架构深度解析
压缩率高 ────────────────────────────────────────────│ (旧消息→9段摘要,~90%压缩)││ (旧消息→笔记,最近保留原文,~70%压缩)││ (只清工具结果,~30%压缩)│低 ────────────────────────────────────────────│<──── 旧 │─────── 近 ──────>│ 新 ││ 轮次 轮次 │轮次│。
2026-04-01 08:53:59
643
原创 用 Vue 3 重构 Dify 聊天前端(下篇):高级功能与优化
篇章核心内容上篇项目搭建、类型设计、路由认证、HTTP 封装、Pinia Store中篇SSE 流式聊天、ChatView 核心逻辑、Markdown 渲染、文件上传、会话管理下篇组件拆分、工作流可视化、Agent 思考过程、响应式适配、性能优化、部署SSE 流式核心:fetch + ReadableStream + 行缓冲 + 回调分发,与 UI 完全解耦消息更新策略:先添加空占位消息,然后通过直接修改数组元素属性实现流式更新组件通信。
2026-03-31 12:05:11
309
原创 用 Vue 3 重构 Dify 聊天前端(中篇):核心功能实现
isThinking?: boolean // 是否正在思考: string[] // 建议问题列表: boolean // 是否显示操作按钮// 核心状态isThinking?: boolean // 是否正在思考 suggestedQuestions?: string [ ] // 建议问题列表 showActions?
2026-03-31 12:02:00
367
原创 用 Vue 3 重构 Dify 聊天前端(上篇):项目搭建与基础架构
Dify 是一个开源的 LLM 应用开发平台,提供了对话式 AI 的后端服务。在实际项目中,我们往往需要自建前端来对接Dify后端 API或LLM后端服务,实现定制化的聊天界面。用 Vue 3 构建一个生产级的 AI 聊天前端SSE 流式输出(打字机效果)Markdown 渲染 + 代码高亮用户认证文件/图片上传聊天会话历史管理工作流执行可视化Agent 思考过程展示移动端响应式适配。
2026-03-31 11:58:59
828
原创 写给 AI 的散文:意图式提示词写作指南
摘要: 意图式提示词设计理念强调通过描述AI的理想品格和期望状态(如"你是别人生活中的客人"),而非机械规则(如"绝不可以..."),来引导AI行为。这种基于语义激活和隐喻的方式比传统限制式规则更具泛化能力,能激发AI自主推理,避免规则漏洞,且更易维护。写作时应聚焦"成为什么"而非"不能做什么",用自然语言解释原因,保持语气一致,允许AI有态度。关键场景(如安全底线)仍需明确规则,但多数情况下意图式设计能产生更智能、人性化的AI
2026-03-30 16:41:52
528
原创 从CLI到分布式智能体:重新理解AI Agent的演进路径与工程现实
本文探讨了AI Agent在实际工程落地中的关键问题与演进方向。文章指出当前对Agent存在严重误解,强调Agent不是单一程序而是分布式系统结构,其核心在于智能与执行的分离。通过分析云端Agent和本地Agent的优劣势,提出未来方向应是分层协作:云端负责思考决策,本地负责环境执行。文章深入剖析了CLI Agent作为"半个Agent Runtime"的真实角色,并指出Agentic与Workflow并非对立而是互补关系。同时揭示了Prompt约束的局限性,强调需要结合系统层的硬控制来
2026-03-30 11:24:01
455
原创 Anthropic Economic Index: AI对软件开发的影响 — 深度解读
摘要:Anthropic研究显示,AI正深刻改变软件开发领域。专业编码代理Claude Code的自动化比例达79%,远超通用AI(49%)。Web前端开发(JavaScript/HTML/CSS占59%)最受AI影响,出现"氛围编码"新现象。初创企业采用率(32.9%)显著高于传统企业(23.8%)。研究预测:1)前端开发将首波自动化;2)开发者角色将转向架构设计/AI工作流管理;3)AI编码能力可能加速AI自身发展。建议从业者掌握AI工具,向高阶设计转型。该研究为观察AI对经济影响的
2026-03-25 17:01:32
404
原创 从 LLM 接口到 Agent 接口:AI 融合系统的架构演进与未来趋势分析报告
AI执行中间层的标准化趋势:Agent Runtime的演进与挑战 AI正从单纯问答转向任务执行,推动大模型向"任务执行者"演进。当前Agent技术热潮中,各系统重复构建相似的执行中间层,负责目标拆解、工具调度、状态管理等基础能力,造成资源浪费。随着工具协议(如MCP)逐步统一,Agent Runtime有望被抽象为平台层或SaaS服务,降低企业AI接入成本。 核心趋势包括:工具层标准化不可逆,但Runtime因执行哲学差异难以完全统一,更可能形成多样实现与趋同接口;Runtime Sa
2026-03-24 00:03:34
845
1
原创 大模型没有记忆,Agent不是革命:一个关于AI系统的残酷真相
摘要:大模型Agent的本质与局限 当前大模型Agent系统存在一个根本性矛盾:我们构建的"智能体"本质上是由传统软件工程(Harness)包装的无状态函数。大模型本身不具备记忆能力,所有"智能表现"都依赖外部系统实现:上下文拼接、向量检索、Prompt工程等。这种架构导致: 真正的"智能推理"只占流程很小部分 系统可靠性依赖工程实现而非模型能力 现有类比(如电脑架构)存在根本性误导 我们正用确定性工程方法包装概率性系统,这种矛盾可能推动下一代AI
2026-03-20 09:36:01
399
原创 从“人对齐人”到“人对齐Plan”:一种面向AI时代的小团队工程范式
摘要: 在AI时代,软件开发团队协作面临新挑战:个体使用AI的方式差异导致效率发散。传统“人对齐人”模式转向“人对齐Plan”,即由核心成员制定结构化Plan(目标、约束、步骤、验证),压缩AI和人的自由发挥空间。执行者角色转变为驱动AI和校准结果,形成“AI为动力、Plan为轨道、人为方向盘”的协作范式。该方法通过强约束协议降低个体差异影响,提升交付稳定性,适合3-8人团队轻量落地,本质是将协作升级为“结构化协议驱动”,实现认知固化与执行放大的平衡。
2026-03-17 15:50:45
364
原创 什么是“龙虾”OpenClaw?我们能不能“养”?要不要“养”?
OpenClaw的爆火,是AI应用史上的一个标志性事件。它像一面镜子,照出了我们对“AI智能体”未来的无限憧憬,也照出了技术狂奔时被抛下的安全问题。2026年,很可能被定义为。
2026-03-11 19:58:27
475
原创 什么是 OpenClaw —— 从 CLI AI 工具到 AI Agent 的演进
从技术本质来看,OpenClaw 并不是神秘或复杂的新技术。利用大模型进行决策通过工具执行实际操作通过循环机制持续推进任务提示词 + 工具 + 多轮推理循环 的工程化实现。但它所代表的趋势值得关注:AI 的角色正在从“回答问题的工具”,逐渐演变为“能够执行任务的系统”。同时,通过聊天工具的接入,人类与 AI 的协作方式也正在发生变化——用户不再只是坐在电脑前使用 AI,而是可以随时通过聊天软件指挥 AI 完成工作。
2026-03-11 14:57:01
399
原创 Dify 前端架构与核心功能详解
本文介绍了基于Next.js和Dify的聊天应用前后端交互流程。前端通过Service层发起请求,Next.js API Routes处理请求并调用Dify SDK。Dify后端API服务采用SSE流式响应机制,实现实时消息推送。系统包含历史对话加载、响应类型渲染等核心功能,通过组件化架构实现高效交互。关键代码展示了消息获取、发送及流式处理逻辑。
2026-03-05 01:34:42
297
原创 Nanobot 代码分析
Nanobot 代码分析摘要 本文档分析了Nanobot智能体项目的核心机制,主要包括: 工具调用机制:仅实现Function Call流程,未实现MCP协议。核心流程包括LLM返回tool_calls、解析执行工具、再次调用LLM生成响应。关键代码位于litellm_provider.py和loop.py。 Skill系统:采用三级加载机制(Metadata/SKILL.md/Resources),通过SkillsLoader类管理。每个skill包含SKILL.md定义文件、scripts目录和reso
2026-02-24 00:13:37
458
原创 glm-4.7-flash本地部署
摘要:本文介绍了在双4090 GPU(48GB*2)环境下,使用vllm/vllm-openai:nightly镜像运行GLM-4.7-Flash模型时遇到的transformers版本过低问题及解决方案。通过构建自定义Docker镜像升级transformers和accelerate包,并提供了详细的运行命令和参数配置。同时给出了爆显存时的调整建议,包括修改--max-model-len和--max_num_seqs参数值。文章还包含通过docker bash手动升级测试的完整流程,以及验证版本和手动启动
2026-02-09 20:19:29
747
原创 nanobot-技能与工具调用机制详解
nanobot智能体采用模块化技能系统与工具调用机制实现功能扩展。技能通过标准Markdown文件定义,包含YAML元数据和详细指令,支持渐进式加载策略。工具调用遵循OpenAI标准格式,包含完整的注册、模式生成、执行循环流程。系统优先加载工作区技能,自动检查依赖条件,并生成XML摘要供智能体按需调用。核心实现位于skills.py和tool_call.py,提供从技能发现到工具执行的完整工作流。
2026-02-09 10:39:12
1477
原创 太空:AI未来的新边疆
摘要:太空——AI发展的新前沿 本文探讨了人工智能(AI)未来发展的新方向——太空领域。太空环境具有两大独特优势:取之不尽的太阳能资源可为AI提供持续电力;极低温环境可解决服务器散热难题。虽然当前面临发射成本高、维护困难等挑战,但随着星链计划等技术的推进和发射成本降低,太空AI将迎来广阔发展前景。作者认为,尽管存在诸多挑战,太空仍将成为AI发展的理想平台,创造巨大的经济和社会价值。
2026-01-20 19:08:06
414
原创 linux服务器部署comfyui
本文介绍了在Linux服务器上部署ComfyUI的完整流程:1)下载源代码并上传服务器;2)建议使用Python3.10创建conda虚拟环境;3)安装依赖包;4)运行main.py并配置参数(包括显卡选择、端口设置、显存模式等);5)通过浏览器访问Web界面;6)选择模板并下载模型文件。文章还提供了参数说明和截图指导,包括如何调整模型量化参数等实用技巧。整个部署过程清晰简洁,适合快速搭建ComfyUI服务环境。
2026-01-16 15:53:28
231
原创 20251201之AI思考
谈谈,最近使用AI的感受,我身为一个程序员,我用的最多的就是写文档,润色方案,还有就是简单前端项目,基本上通过提示词也能实现个七七八八。以至于,我一个问题,我会同时发给三个不同类型的AI,deepseek、kimi、gemini,我只想通过问一次问题,就要得到70%的预期,只能一次性问多个,提高这个预期的概率。其实现在有个浮躁的点,各种自媒体都宣传AI如何如何,大部分也都有深入的使用AI,从编程到生图到写作,方方面面AI都在慢慢的融入我们的生活。之前做产品,缺一个程序员的时代,理论上在慢慢的消失。
2026-01-03 08:50:05
234
TCPSocketSelect模型框架
2016-12-14
C++ Doodle Jump源码
2017-03-06
libevent创建客户端&服务端demo
2019-03-20
快速内存(内存复用)技术.zip
2020-01-02
win10任务管理器,隐藏指定服务?
2019-03-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅