许泽宇的技术分享

微软最有价值专家（Al Platform MVP），华为云开发者专家（HCDE），飞浆技术专家，NebulaGraph认证专家，Neo4j认证专家，上市公司首席架构师，专注.Net 和AI相关技术，内容涵盖教程、技巧、行业动态及解决方案

Agent

关注

文章平均质量分 96

关注数：文章数：75 文章阅读量：466082 文章收藏量：1521

作者: OPC超级个体实验室

微软最有价值专家（AI方向MVP）、华为云开发者专家（AI方向）、飞浆开发者技术专家（PPDE）、NebulaGraph认证专家及社区官方布道师、Neo4j认证专家、CSDN 2025年度博客之星TOP4，深耕AI Agent领域。

展开

专栏收录文章

我养了一只会“自学“的AI Agent：拆解Hermes Agent的“闭环进化术“，看完才知道Agent还能这么写

它不是一个一次性消耗品，而是一个会跟你一起变老的伙伴。它会记得你说过的话，会从你们的相处里总结小窍门，会在凌晨默默整理自己的笔记，会在你换app时悄悄跟过来，会在你不需要它时安静地睡觉。这种"持续陪伴感"，是当前大多数Agent产品稀缺的。如果你正在做Agent项目，强烈建议把Hermes的源码当一本"反模式参考书"来读——它在你将要踩的每一个坑前，都留了一个写着"前方有坑，已填埋，附图"的小路标。hermes剩下的，让它自己长大就好。"Hermes，希腊神话里那位脚踩飞鞋的信使之神。

原创 2026-05-18 14:17:05 · 2129 阅读 · 0 评论
当 AI 长出了手脚：深度解析 Hermes Agent 的「工具调用宇宙」

有个不起眼但很贴心的细节：当预算用完时，系统会给模型一次额外的最终调用机会），但这次不允许再使用工具，只能输出文字。这样即使任务没完全完成，模型也能礼貌地告知用户当前进度，而不是突然断电般消失。一是"防御性"贯穿始终。从防管道崩溃，到护栏系统防模型无限循环，再到 prompt 注入扫描，处处体现出"假设一切都会出错"的工程心态。这不是悲观主义，这是经验。二是"抽象边界"的坚守。

原创 2026-05-11 10:20:45 · 2406 阅读 · 0 评论
你的AI是怎么学会新技能的？深挖ClawHub这台“技能自动贩卖机“的底层密码

回到文章开头的那个场景——你的 AI 助手突然学会了点咖啡。这背后发生的一切，本质上是 ClawHub 这台"技能自动贩卖机"在默默运转：有人在某个角落写好了技能文件，上传到注册表；向量搜索引擎把它编入了语义索引；安全扫描确认它没有问题；你的 AI 通过 CLI 发现了这个新技能，下载、安装、生效。整个过程快到你几乎感知不到，但每一步都有扎实的工程底座在支撑。AI 的能力边界，不只取决于模型有多大，还取决于生态有多开放、分发有多高效、信任有多牢固。

原创 2026-05-11 09:42:55 · 2166 阅读 · 0 评论
别再把 AI Agent 当“会聊天的脚本”：Hermes Agent 源码级拆解（架构、框架、实战、趋势，一文吃透）

不是在谈“模型参数有多大”，也不是在谈“能连多少 API”。我们真正该谈的是：它能否稳定运行？能否长期进化？能否被团队协作？能否在成本与风险之间找到平衡？Hermes Agent 的源码给出了一个很务实的答案：把 Agent 当系统工程做，而不是当提示词魔法做。这也是它最值得技术人深入研究的地方。这不是一篇“AI Agent 入门科普”，而是一篇“源码级工程拆解”。从。

原创 2026-05-06 22:40:31 · 2283 阅读 · 0 评论
我认真拆了一个开源 Agent 项目后，发现下一代效率工具已经不是“聊天机器人”了

这两年，大家都在讲 AI Agent。但说实话，市面上很多所谓的 Agent，本质上还是“套了工具的大模型聊天框”。它能回答问题，能写代码，能生成内容，可一旦你关掉页面、换个设备、切个工作场景，它往往又回到“重新认识你”的起点。最近我认真看了一个开源项目，叫 Hermes Agent。越往里看，我越确定一件事：未来真正有竞争力的 Agent，不会只是一个会聊天的入口，而会成为一个长期在线、跨场景协作、不断积累经验、还能持续进化的数字执行体。而 Hermes Agent，已经把这条路走得很清楚了。

原创 2026-05-01 17:15:35 · 2050 阅读 · 0 评论
我用唐朝的三省六部制，重新设计了 AI 多 Agent 协作架构——然后 CrewAI 和 AutoGen 在我眼里都不香了

摘要：本文介绍了一种受唐朝三省六部制启发的多Agent系统架构设计，解决了传统多Agent系统缺乏审核机制导致的混乱问题。系统包含12个具有明确职责的Agent，其中"门下省"作为质量守门员强制审核所有方案，不合格则直接驳回。作者详细阐述了状态机设计、双通道事件总线、崩溃恢复机制等关键技术实现，以及标题清洗、SOUL.md规范等细节优化。该架构通过制度化的审核流程和清晰的责任划分，显著提升了多Agent协作的可靠性和可观测性，为复杂任务处理提供了新的解决方案思路。

原创 2026-03-15 15:59:56 · 12804 阅读 · 0 评论
WebCode 与 Clawdbot 项目深度对比分析

项目WebCodeClawdbot定位在线 AI 全能工作平台（Web）个人 AI 助手框架（CLI/Gateway）核心技术架构风格分层架构 + DDDGateway-Channel-Agent 三层架构主要功能远程驱动 AI CLI 助手多渠道消息统一接入 + AI Agent 交互目标用户需要 Web 远程控制的开发者需要全平台 AI 助手的个人用户许可证AGPLv3MIT差异维度WebCodeClawdbot架构理念Web 驱动 CLI技术栈扩展性适配器模式插件系统生态。

原创 2026-01-26 21:15:46 · 11775 阅读 · 0 评论
当AI编程工具遇上“配置地狱“：一个开发者的自救指南

回到文章开头的场景，ACP带来了什么改变？Before ACP❌ 每次切换工具都要重新配置❌ 配置散落在各处，难以管理❌ 团队成员配置不一致❌ 优秀配置无法复用After ACP✅ 一次配置，到处运行✅ 统一管理，版本控制✅ 团队标准化，一键同步✅ 社区共享，持续改进AI编程工具正在改变软件开发的方式，但工具的碎片化也带来了新的问题。ACP的出现，让我们看到了解决这个问题的可能性。当遇到重复性问题时，不要忍受，而是创造工具去解决它。这正是开源精神的体现：发现问题、解决问题、分享方案。

原创 2026-01-25 22:27:48 · 11930 阅读 · 0 评论
当 AI 学会“造沙箱“：OpenSandbox 如何让大模型安全地执行代码

阿里巴巴开源OpenSandbox：AI代码执行的"安全游乐场" 随着AI编程助手的普及，如何安全执行AI生成的代码成为关键问题。OpenSandbox提供了一套开源解决方案，其核心特点包括：四层架构设计： SDK层：多语言支持 Specs层：定义API规范 Runtime层：支持Docker/K8s Sandbox实例：独立容器环境创新技术亮点：无侵入式execd注入机制集成Jupyter多语言内核智能过期清理系统精细网络隔离策略核心优势：开源可控数据自主国内友好部

原创 2026-01-23 22:13:34 · 15881 阅读 · 0 评论
BotSharp 入门教程-第03章-快速启动

本文介绍了BotSharp项目的克隆、启动、测试和调试流程。主要内容包括：项目克隆选择合适的存放路径（避免中文/空格）使用git clone命令克隆项目解决常见克隆问题（网络、路径、速度等）项目启动配置LLM提供商（OpenAI等）通过Visual Studio或命令行启动验证启动成功（端口监听、Swagger UI）常见启动错误排查（端口占用、SDK版本等） API测试使用Postman/curl/Swagger测试API 完整测试流程：创建对话→发送消息→完成订单错误响应分析与处理

原创 2026-01-20 11:34:20 · 15612 阅读 · 0 评论
从“手机上写代码“的疯狂想法，到一套完整的AI编程平台架构——WebCode深度技术剖析

本文分享了作者开发移动端AI编程助手的实战经验。从最初"套壳"的简单需求出发，逐步深入解决适配不同CLI工具、流式输出处理、工作区隔离等核心难题。文章重点介绍了适配器模式的设计、智能上下文管理系统、移动端特殊问题处理等关键实现方案，展现了从零设计分布式AI编程平台的完整思考过程。作者通过性能优化、安全防护等多维度实践，将产品从"能用"提升到"好用"状态，并展望了多模型对比、实时协作等未来发展方向。全文生动呈现了一个看似简单需求背后复杂的技术挑战和解

原创 2026-01-20 11:09:24 · 11252 阅读 · 0 评论
当AI学会拍短剧：Huobao Drama全栈AI短剧生成平台深度解析

《AI短剧制作革命：HuobaoDrama项目技术解析》摘要本文介绍了一个创新的开源项目HuobaoDrama，它利用AI技术实现了从创意到完整短剧的全流程自动化制作。该项目采用Go+Vue3全栈架构，集成OpenAI、Gemini等AI服务，具备剧本生成、角色设计、分镜拆解、视频合成等核心功能。技术亮点包括：DDD领域驱动设计的多层架构、统一抽象的AI服务接口、智能分镜生成算法、基于FFmpeg的专业视频处理，以及支持多语言的现代化前端。项目通过SQLite+WAL模式解决并发问题，采用多阶段Docke

原创 2026-01-19 11:52:19 · 9611 阅读 · 0 评论
当AI学会炒股：揭秘VibeAlpha Terminal如何用大模型重新定义金融分析

回到开头的问题：为什么要做VibeAlpha？因为我懒。但这种"懒"，其实是一种对效率的极致追求。程序员的天职，就是用代码消灭重复劳动。如果一件事要做两遍，就应该写个脚本；如果一件事要做一百遍，就应该做成系统。VibeAlpha就是这种思想的产物。它不完美，但它真的能用。每天早上，我打开电脑，一份热乎的盘前报告已经躺在那里等我了。这种感觉，比赚钱还爽。项目地址技术栈欢迎Star、Fork、提Issue！更多AIGC文章RAG技术全解：从原理到实战的简明指南更多VibeCoding文章。

原创 2026-01-19 10:33:58 · 11233 阅读 · 0 评论
地铁上也能写代码？这个开源项目让AI编程助手装进了你的手机

技术选型理由服务端渲染+SignalR实时通信，完美支持流式输出成熟的企业级UI组件库，开箱即用VS Code同款编辑器内核，专业级代码展示轻量级ORM，支持多数据库切换Docker一键部署，环境隔离你可能会问：为什么选Blazor而不是React/Vue？我觉得这是一个非常务实的选择。Blazor Server模式的最大优势是——所有代码都在服务端运行。前后端天然统一：不需要写两套代码、处理CORS、维护API接口实时通信开箱即用：SignalR自动管理WebSocket连接流式输出天然支持。

原创 2026-01-17 22:08:38 · 15846 阅读 · 0 评论
踩坑三周，我终于把 Claude Code 和 Codex 塞进了浏览器— 一个让手机也能写代码的疯狂想法

《在地铁上写代码：一个移动端AI编程助手的诞生》讲述了作者如何开发一款能在手机上远程调用AI编程工具的项目。文章详细记录了从灵感萌发到技术实现的完整过程，包括采用Blazor Server解决流式输出难题、适配器模式统一不同CLI工具接口、IndexedDB实现本地会话存储等关键技术方案。特别分享了移动端适配的44px触摸优化、工作区隔离的安全设计等细节经验，并坦承了处理JSON边界情况、Windows只读属性等踩坑经历。该项目突破了传统编程工具必须依赖电脑的限制，让开发者能随时随地通过浏览器进行编码工作。

原创 2026-01-15 17:36:21 · 10174 阅读 · 0 评论
手机上写代码、做PPT、分析Excel？这款“AI 全能工作台“让我随时随地都能工作

工作这件事，本来就不应该被设备和场景限制。躺沙发上突然想到一个好点子？掏出手机让 AI 帮你实现地铁上 review 代码发现问题？直接让 AI 修复咖啡馆里想起 PPT 没做？打开网页几分钟搞定这才是我理想中的工作方式。场景能力📝编程写代码、改 bug、code review、重构优化📊数据Excel 分析、图表生成、数据处理📑文档PPT 制作、Word 编辑、PDF 处理🎨设计UI 优化、海报设计、艺术生成🧪测试自动化测试、截图对比、日志分析所有这些，只需要一个浏览器。

原创 2026-01-14 17:22:54 · 11216 阅读 · 0 评论
手机上写代码、做PPT、分析Excel？我用 Blazor 搞了个“AI 全能工作台“，踩坑无数终于跑通了

摘要：本文分享了一个基于Blazor开发的手机端AI全能工作台项目，让用户可以通过浏览器远程调用AI完成编程、数据分析、PPT制作等任务。项目采用适配器模式解决不同CLI工具的兼容问题，通过分层缓存和防御性编程优化性能，并集成16个官方Skills实现多场景应用。作者详细介绍了技术选型、架构设计中的关键决策，以及移动端适配、进程管理等实践中的坑与解决方案。该项目将云端编程助手升级为AI全能工作台，支持随时随地通过手机完成代码编写、Excel分析、PPT制作等复杂工作。

原创 2026-01-14 16:33:49 · 9693 阅读 · 0 评论
深度解析Claude Agent Skills：我是如何理解AI能力模块化这件事的

研究Skills这三天,我最大的收获不是学会了怎么写YAML或者怎么组织文件,而是重新理解了AI应用开发的本质。我们不是在"调教"AI,而是在为AI设计工作环境。就像你不会把新员工扔进办公室说"自己看着办",而是会：给他岗位说明书(SKILL.md)提供工具和模板(scripts/assets)准备参考资料(references)告诉他遇到问题该查什么(明确的引用)Skills的设计哲学完美诠释了这一点。另外,我越来越觉得**AI应用开发正在从"艺术"走向"工程"**。

原创 2026-01-14 11:19:38 · 11110 阅读 · 0 评论
用上这个Skill，你的Claude Code/Codex 将会比别人快5倍 -- 用分布式思维驯服AI任务编排

本文探讨了一种优化AI任务执行效率的新思路——将分布式系统理念应用于AI任务编排。作者发现传统"单线程"使用AI的方式存在效率低下、输出混乱等问题，提出通过任务分解、并行执行和结果聚合的三步法来提升效率。核心在于将复杂任务拆分为独立原子任务，由多个"虚拟Agent"并行处理，最后统一整合输出。文章详细介绍了四阶段工作流设计、三种依赖关系处理模式以及三层容错机制，并通过代码审查、文档翻译等案例展示了3-4倍的效率提升。作者强调这不仅是一种技术方案，更是一种结构化解决问题

原创 2026-01-13 14:04:50 · 10849 阅读 · 0 评论
踩坑三个月，我用 Blazor 重构了一个 AI UI 协议，这些教训值得你看看

本文分享了作者在实现A2UI协议的Blazor版本时遇到的技术挑战和解决方案。文章重点探讨了七个关键问题：声明式UI设计解决了AI生成界面的安全性问题；数据绑定系统的三层解析机制；消息驱动架构确保状态一致性；处理JsonElement类型的坑；利用Blazor的DynamicComponent实现动态渲染；可配置主题系统的设计；以及性能优化策略。作者还提出了未来改进方向，包括扩充组件库、支持SSR等。整个项目从最初的不确定性到最终实现，展现了架构设计的重要性，为类似动态UI项目提供了宝贵经验。

原创 2026-01-11 21:29:35 · 10946 阅读 · 0 评论
痛定思痛：我花了一个月重构 AI 助手，只为了解决这三个问题

本文分享了重构AI助手Kode的设计思考与实现细节，重点解决了多模型协作、智能补全、流式架构等核心问题。通过模型指针系统实现运行时切换，采用混合算法优化补全体验，利用AsyncGenerator提升交互流畅度。文章还探讨了Subagent上下文隔离、MCP工具集成等高级功能，并总结了性能优化和跨平台兼容的实践经验。最后展望了上下文压缩、本地模型支持等未来方向，为AI助手开发提供了实用参考。

原创 2026-01-10 20:56:32 · 11078 阅读 · 0 评论
Claude Code深度解析：当AI不再是“代码生成器“，而是你的技术合伙人

ClaudeCode：重新定义AI编程助手的"技术合伙人" 摘要： ClaudeCode颠覆了传统AI编程工具的概念，从"代码补全助手"进化为"技术合伙人"。其核心创新在于代理系统（Agentic System）设计，能够主动提问、并行分析、协作决策。通过插件架构、Hook系统和多代理协作机制，ClaudeCode实现了从需求分析到代码审查的全流程智能化支持。实际案例显示，其可将复杂功能开发时间从3-5天缩短至4小时，同时保证代码质量。相比GitH

原创 2026-01-08 16:19:19 · 13540 阅读 · 0 评论
价值20亿美元的秘密：让AI不再“失忆“的工作记忆法

《AI代理如何避免"遗忘"：20亿美元收购背后的文件管理智慧》 Meta以20亿美元收购的AI公司Manus揭示了一个简单却革命性的解决方案：教会AI"记笔记"。传统AI助手在执行复杂任务时存在致命缺陷——随着操作次数增加，会逐渐遗忘初始目标。Manus通过创建三个Markdown文件(task_plan.md记录任务计划，notes.md存储研究发现，[deliverable].md作为最终交付)完美解决了这个问题。这种文件系统作为"外部大脑"

原创 2026-01-07 00:26:33 · 10770 阅读 · 0 评论
当AI遇上PPT：揭秘ALLWEONE演示文稿生成器的技术魔法

《ALLWEONE AI演示生成器：开源PPT制作新方案》摘要：ALLWEONE是一款基于现代Web技术栈的开源AI演示文稿生成工具，通过三层架构设计实现从主题输入到精美演示的一站式解决方案。项目采用Next.js+TypeScript技术组合，集成AI内容生成、9套可定制主题和Plate.js富文本编辑器，支持流式生成和多语言输出。其核心创新在于结构化提示词工程和插件化设计，使AI能够智能选择15种专业布局并生成详细配图建议。相比商业竞品，ALLWEONE在开源可控性、隐私保护和本地模型支持方面具有优势

原创 2025-12-29 17:53:49 · 10597 阅读 · 0 评论
当AI遇见UI：用.NET Blazor实现Google A2UI协议的完整之旅

Google推出的A2UI协议为AI生成用户界面提供了创新解决方案。本文详细解析了基于.NET9 Blazor的A2UI实现，其核心优势在于：1)通过JSON数据而非代码生成UI，确保安全性；2)采用声明式设计，实现跨平台原生渲染；3)优化LLM友好性，使用邻接表结构。文章深入剖析了四层架构设计、18+标准组件实现、数据绑定机制和主题系统，并展示了餐厅预订助手的完整应用案例。相比传统方案，A2UI在安全性、可移植性和AI友好性方面具有显著优势，为AI时代的UI开发提供了新范式。

原创 2025-12-28 23:36:10 · 9389 阅读 · 0 评论
AI驱动的智能研究助手：从零到一打造人机协作的研究画布

摘要：本文介绍了一款名为open-research-ANA的智能研究助手系统，它通过LangGraph状态机架构实现了高效的人机协作研究流程。系统集成了实时搜索、大纲生成和内容写作等功能，采用Tavily搜索引擎和GPT-4模型，支持多查询并发和流式内容输出。其创新之处在于采用Human-in-the-Loop设计理念，通过中断机制确保用户始终掌握研究主导权。前端采用Next.js实现分屏交互界面，支持实时状态显示和本地存储。该系统可应用于学术研究、市场调研等多个场景，显著提升研究效率，展示了AI增强而非取

原创 2025-12-25 22:15:09 · 12321 阅读 · 0 评论
当数据分析遇上AI：airda让你用聊天的方式玩转SQL

AirDataAgent（airda）是一个面向数据分析的多智能体系统，通过自然语言处理技术实现从用户提问到SQL查询的自动转换。其核心价值在于降低数据分析门槛，让非技术人员也能轻松查询数据。系统采用分层架构设计，包含框架层、智能体层和应用层，通过RAG技术和向量检索实现表结构智能匹配。airda的工作流程分为需求确认、任务规划、任务执行和结果交付四个步骤，支持多智能体协作完成数据查找、SQL生成、代码编写和可视化展示。目前支持MySQL数据源，未来计划扩展更多数据库类型并增强业务知识理解能力。该项目展现了

原创 2025-12-25 22:03:15 · 12257 阅读 · 0 评论
当AI Agent学会“打电话“——微软Agent Framework的A2A与AGUI协议深度解析

微软AgentFramework通过A2A和AGUI协议实现了AI智能体之间的高效协作，构建了类似微服务的分布式AI系统。A2A协议定义了智能体间的通信标准，支持异步任务和上下文保持；AGUI协议则规范了智能体与客户端的交互，支持混合执行模式。这种架构将复杂功能分解到专业智能体，通过标准协议协同工作，既提升了系统扩展性，又降低了维护成本。框架采用.NET实现，提供流式响应、任务续传等特性，适用于从简单查询到复杂协作的各种场景。未来，这种智能体网络架构有望推动AI应用向更模块化、可互操作的方向发展。

原创 2025-12-24 21:45:21 · 11248 阅读 · 1 评论
AgentFramework:生产环境清单

本文提供了一份AI代理上线前的完整检查清单，涵盖安全、性能、可靠性等关键维度。安全方面强调密钥管理、数据保护和网络安全；性能检查包括优化策略和资源配置；可靠性涉及错误处理和容错能力。同时详细说明了监控告警配置方法，包括日志记录、指标收集和告警规则设置。最后提出运维最佳实践，包括蓝绿部署、备份恢复策略和定期维护任务。通过这套系统化方案，确保AI应用在生产环境中的稳定运行，并实现持续优化。

原创 2025-12-21 23:41:53 · 12283 阅读 · 0 评论
AgentFramework:测试方法

本文系统介绍了AI应用开发中的测试方法与实践。主要内容包括：1）单元测试（使用xUnit框架测试工具函数、输入验证等核心功能）；2）集成测试（验证与AI服务交互、工具调用等真实场景）；3）测试最佳实践（AAA模式、单一职责测试、覆盖率目标等）。通过代码示例展示了如何构建有效的测试体系，强调测试不仅能提前发现问题，还能作为代码文档。文章还提供了持续集成配置方案和测试检查清单，帮助开发者建立完整的质量保障机制。

原创 2025-12-21 23:41:10 · 12521 阅读 · 0 评论
AgentFramework:错误处理策略

本文系统介绍了AI代理应用开发中的错误处理策略，包括四种常见错误类型（网络、API、输入和系统错误）及处理原则。重点阐述了异常捕获、错误分类、重试机制和断路器模式等关键技术，并提供了完整的C#代码示例。文章还提出了包含自定义异常、中间件、日志记录和监控告警的完整错误处理框架，最后给出部署前的检查清单，强调优雅处理错误对保障应用稳定性和用户体验的重要性。

原创 2025-12-21 23:40:22 · 10331 阅读 · 0 评论
AgentFramework: 安全最佳实践

本文详细介绍了开发AI代理应用时的安全最佳实践。重点包括：1）API密钥管理（避免硬编码、使用环境变量或KeyVault）；2）数据保护策略（敏感信息脱敏、加密存储、访问控制）；3）输入验证（检查长度、速率限制、恶意内容检测）；4）输出清理（移除危险内容）。文章提供了具体代码示例和安全检查清单，强调安全性是持续过程而非一次性工作。通过实施这些措施，可以有效保护API密钥、用户数据和应用安全。

原创 2025-12-21 23:39:38 · 15509 阅读 · 0 评论
A2UI与AG-UI深度对比：两大AI界面协议的异同与选择

摘要：A2UI与AG-UI协议对比解析 A2UI（Google开源）与AG-UI（CopilotKit团队开源）是两类功能迥异的AI协议： A2UI：专注UI生成，通过声明式JSON描述界面结构，支持跨平台渲染（Web/移动端），采用白名单机制保障安全性，适用于表单、数据展示等场景。 AG-UI：提供智能体交互协议，标准化消息、状态、工具调用等实时通信，适配LangGraph等主流框架，适合全功能智能体应用开发。两者可独立或组合使用（如AG-UI传输A2UI的UI描述），选择取决于需求：优先A2UI：跨

原创 2025-12-21 22:56:56 · 9868 阅读 · 0 评论
从Agent视角看A2UI：智能体终于学会了用界面“说话“

A2UI协议为智能体带来界面生成能力革命，使其从单一文本交互升级为多模态UI交互。核心优势包括：1）表达能力突破，支持生成卡片、表单、图表等丰富组件；2）交互效率提升，通过智能预填和渐进式引导优化用户体验；3）跨平台兼容性，统一JSON格式适配各类终端；4）安全沙箱机制，确保组件生成的安全性。该协议使智能体能根据上下文动态生成最适合的界面，大幅提升任务完成率和用户满意度，代表AI交互方式的重大升级。

原创 2025-12-21 22:32:45 · 16324 阅读 · 0 评论
聊天一开，架构图自动长出来：Next AI Draw.io 深度拆解与实战指南

《AI绘图新范式：NextAIDraw.io的技术实现与应用价值》摘要： NextAIDraw.io创新性地将AI对话与draw.io绘图工具结合，通过自然语言指令快速生成专业图表。该系统采用分层架构设计：前端基于Next.js实现交互界面，后端通过多云模型API处理用户请求，核心创新点在于XML校验修复机制与双工具调用策略（display_diagram/edit_diagram）。技术亮点包括：严格的状态管理、流式对话响应、智能XML处理工具链，以及多云模型兼容层。该方案有效解决了传统绘图工具操作繁琐

原创 2025-12-08 11:42:28 · 12941 阅读 · 0 评论
当AI学会“自己动手，丰衣足食“：深度剖析AgentGPT的自主智能之路

摘要： AgentGPT是一款突破性的自主AI代理，不同于传统问答式AI，它能根据用户目标自主拆解任务、调用工具并生成完整解决方案。其技术架构采用前后端分离设计，前端基于Next.js+React，后端使用FastAPI+LangChain，支持多语言输出、流式响应和动态Token管理。核心创新在于"Plan-and-Solve"工作流：目标拆解→工具选择→任务执行→结果评估→循环迭代，并集成搜索、代码生成等工具。项目开源且支持扩展，未来或强化记忆、多Agent协作等能力，标志着AI从&

原创 2025-12-07 22:44:29 · 8132 阅读 · 0 评论
当AI竞赛遇上云原生：EvalAI如何用450+挑战赛重新定义机器学习评估标准

EvalAI的故事告诉我们，在技术快速迭代的AI时代，"标准制定者"往往比"技术领先者"拥有更持久的竞争优势。就像HTTP协议成就了互联网，SQL标准统一了数据库一样，EvalAI正在AI评估领域扮演着类似的"基础设施"角色。从450+挑战赛的成功举办，到51,000+用户的积极参与，EvalAI已经证明了自己不仅仅是一个技术平台，更是一个连接全球AI研究者的"数字巴别塔"。它让不同语言、不同文化背景的研究者能够在统一的标准下进行公平的竞争和合作。

原创 2025-12-06 16:10:56 · 11492 阅读 · 0 评论
当 PPT 也开始“自己写自己”：一个多智能体系统从想法到整套演示稿的完整落地实践

MultiAgentPPT是一个基于多智能体协作的PPT自动生成系统，通过任务分解和并行处理，将PPT制作过程拆解为大纲生成、主题拆分、资料检索、内容撰写和质量检查等环节。系统采用前后端分离架构，前端使用Next.js+TailwindCSS实现交互界面，后端由多个Python服务组成，利用A2A+ADK框架管理智能体协作流程。关键技术包括结构化任务拆解、MCP+RAG检索、流式数据返回和元数据追踪等。该系统适用于行业研究、产品宣讲等结构化PPT场景，能显著提升制作效率，但对创意性强的Keynote类演示支

原创 2025-11-30 11:39:12 · 7585 阅读 · 0 评论
揭秘Langfuse：开源LLM工程平台的技术内核与实战应用

摘要：Langfuse是一款开源LLM工程平台，通过三层架构设计解决AI应用生产化难题。其前端采用Next.js，后端使用tRPC+Prisma实现类型安全，数据层采用PostgreSQL+ClickHouse双引擎。核心功能包括Tracing追踪调用链路、PromptManagement版本控制、Evaluation质量评估和Datasets测试管理。该平台支持Docker快速部署，已集成到LangChain等主流框架，GitHub获16k+星标。Langfuse通过可视化调试、成本监控和批量评估等功能，

原创 2025-11-23 10:19:51 · 1411 阅读 · 0 评论
当AI Agent遇上.NET：微软Agent Framework的架构奥秘与实战启示

微软AgentFramework是一个用于开发AI智能体的分层架构系统，通过三层抽象模型（编排层、智能体层、抽象层）实现多AI服务的统一协作。其核心设计包括：1）AIAgent抽象类实现输入输出标准化；2）AgentThread机制管理会话状态；3）ChatClientAgent通过适配器模式兼容不同AI模型；4）WorkflowBuilder支持图结构编排和条件路由。框架还提供持久化执行、分布式编排等企业级功能，并通过OpenTelemetry实现全链路追踪。该设计体现了接口隔离、依赖倒置等原则，为构建复

原创 2025-11-22 21:35:13 · 1289 阅读 · 0 评论

Agent

作者: OPC超级个体实验室

我养了一只会“自学“的AI Agent：拆解Hermes Agent的“闭环进化术“，看完才知道Agent还能这么写

当 AI 长出了手脚：深度解析 Hermes Agent 的「工具调用宇宙」

你的AI是怎么学会新技能的？深挖ClawHub这台“技能自动贩卖机“的底层密码

别再把 AI Agent 当“会聊天的脚本”：Hermes Agent 源码级拆解（架构、框架、实战、趋势，一文吃透）

我认真拆了一个开源 Agent 项目后，发现下一代效率工具已经不是“聊天机器人”了

我用唐朝的三省六部制，重新设计了 AI 多 Agent 协作架构——然后 CrewAI 和 AutoGen 在我眼里都不香了

WebCode 与 Clawdbot 项目深度对比分析

当AI编程工具遇上“配置地狱“：一个开发者的自救指南

当 AI 学会“造沙箱“：OpenSandbox 如何让大模型安全地执行代码

BotSharp 入门教程-第03章-快速启动

从“手机上写代码“的疯狂想法，到一套完整的AI编程平台架构——WebCode深度技术剖析

当AI学会拍短剧：Huobao Drama全栈AI短剧生成平台深度解析

当AI学会炒股：揭秘VibeAlpha Terminal如何用大模型重新定义金融分析

地铁上也能写代码？这个开源项目让AI编程助手装进了你的手机

踩坑三周，我终于把 Claude Code 和 Codex 塞进了浏览器— 一个让手机也能写代码的疯狂想法

手机上写代码、做PPT、分析Excel？这款“AI 全能工作台“让我随时随地都能工作

手机上写代码、做PPT、分析Excel？我用 Blazor 搞了个“AI 全能工作台“，踩坑无数终于跑通了

深度解析Claude Agent Skills：我是如何理解AI能力模块化这件事的

用上这个Skill，你的Claude Code/Codex 将会比别人快5倍 -- 用分布式思维驯服AI任务编排

踩坑三个月，我用 Blazor 重构了一个 AI UI 协议，这些教训值得你看看

痛定思痛：我花了一个月重构 AI 助手，只为了解决这三个问题

Claude Code深度解析：当AI不再是“代码生成器“，而是你的技术合伙人

价值20亿美元的秘密：让AI不再“失忆“的工作记忆法

当AI遇上PPT：揭秘ALLWEONE演示文稿生成器的技术魔法

当AI遇见UI：用.NET Blazor实现Google A2UI协议的完整之旅

AI驱动的智能研究助手：从零到一打造人机协作的研究画布

当数据分析遇上AI：airda让你用聊天的方式玩转SQL

当AI Agent学会“打电话“——微软Agent Framework的A2A与AGUI协议深度解析

AgentFramework:生产环境清单

AgentFramework:测试方法

AgentFramework:错误处理策略

AgentFramework: 安全最佳实践

A2UI与AG-UI深度对比：两大AI界面协议的异同与选择

从Agent视角看A2UI：智能体终于学会了用界面“说话“

聊天一开，架构图自动长出来：Next AI Draw.io 深度拆解与实战指南

当AI学会“自己动手，丰衣足食“：深度剖析AgentGPT的自主智能之路

当AI竞赛遇上云原生：EvalAI如何用450+挑战赛重新定义机器学习评估标准

当 PPT 也开始“自己写自己”：一个多智能体系统从想法到整套演示稿的完整落地实践

揭秘Langfuse：开源LLM工程平台的技术内核与实战应用

当AI Agent遇上.NET：微软Agent Framework的架构奥秘与实战启示