自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

许泽宇的技术分享

微软最有价值专家(Al Platform MVP),华为云开发者专家(HCDE),飞浆技术专家,NebulaGraph认证专家,Neo4j认证专家,上市公司首席架构师,专注.Net 和AI相关技术,内容涵盖教程、技巧、行业动态及解决方案

  • 博客(555)
  • 资源 (4)
  • 收藏
  • 关注

原创 当 AI Agent 遇上 .NET:一场关于智能体架构的技术探险

说实话,市面上的 Agent 框架已经多到让人眼花缭乱了。LangChain、AutoGPT、AgentGPT……每个都号称能"改变世界"。但当你真正想把它们用到生产环境时,往往会发现:要么太简单,只能跑个 Demo;要么太复杂,学习曲线陡峭得像珠穆朗玛峰。Kode Agent SDK 的出现,像是在这片混乱中投下了一颗"定心丸"。它不是那种"炫技式"的框架,而是实实在在为 .NET 生态打造的生产级 AI Agent 运行时。

2026-01-20 17:04:25 776 1

原创 BotSharp 入门教程-第03章-快速启动

本文介绍了BotSharp项目的克隆、启动、测试和调试流程。主要内容包括: 项目克隆 选择合适的存放路径(避免中文/空格) 使用git clone命令克隆项目 解决常见克隆问题(网络、路径、速度等) 项目启动 配置LLM提供商(OpenAI等) 通过Visual Studio或命令行启动 验证启动成功(端口监听、Swagger UI) 常见启动错误排查(端口占用、SDK版本等) API测试 使用Postman/curl/Swagger测试API 完整测试流程:创建对话→发送消息→完成订单 错误响应分析与处理

2026-01-20 11:34:20 637

原创 从“手机上写代码“的疯狂想法,到一套完整的AI编程平台架构——WebCode深度技术剖析

本文分享了作者开发移动端AI编程助手的实战经验。从最初"套壳"的简单需求出发,逐步深入解决适配不同CLI工具、流式输出处理、工作区隔离等核心难题。文章重点介绍了适配器模式的设计、智能上下文管理系统、移动端特殊问题处理等关键实现方案,展现了从零设计分布式AI编程平台的完整思考过程。作者通过性能优化、安全防护等多维度实践,将产品从"能用"提升到"好用"状态,并展望了多模型对比、实时协作等未来发展方向。全文生动呈现了一个看似简单需求背后复杂的技术挑战和解

2026-01-20 11:09:24 1863

原创 当AI学会拍短剧:Huobao Drama全栈AI短剧生成平台深度解析

《AI短剧制作革命:HuobaoDrama项目技术解析》摘要 本文介绍了一个创新的开源项目HuobaoDrama,它利用AI技术实现了从创意到完整短剧的全流程自动化制作。该项目采用Go+Vue3全栈架构,集成OpenAI、Gemini等AI服务,具备剧本生成、角色设计、分镜拆解、视频合成等核心功能。技术亮点包括:DDD领域驱动设计的多层架构、统一抽象的AI服务接口、智能分镜生成算法、基于FFmpeg的专业视频处理,以及支持多语言的现代化前端。项目通过SQLite+WAL模式解决并发问题,采用多阶段Docke

2026-01-19 11:52:19 1660 1

原创 当AI学会炒股:揭秘VibeAlpha Terminal如何用大模型重新定义金融分析

回到开头的问题:为什么要做VibeAlpha?因为我懒。但这种"懒",其实是一种对效率的极致追求。程序员的天职,就是用代码消灭重复劳动。如果一件事要做两遍,就应该写个脚本;如果一件事要做一百遍,就应该做成系统。VibeAlpha就是这种思想的产物。它不完美,但它真的能用。每天早上,我打开电脑,一份热乎的盘前报告已经躺在那里等我了。这种感觉,比赚钱还爽。项目地址技术栈欢迎Star、Fork、提Issue!更多AIGC文章RAG技术全解:从原理到实战的简明指南更多VibeCoding文章。

2026-01-19 10:33:58 1700

原创 地铁上也能写代码?这个开源项目让AI编程助手装进了你的手机

技术选型理由服务端渲染+SignalR实时通信,完美支持流式输出成熟的企业级UI组件库,开箱即用VS Code同款编辑器内核,专业级代码展示轻量级ORM,支持多数据库切换Docker一键部署,环境隔离你可能会问:为什么选Blazor而不是React/Vue?我觉得这是一个非常务实的选择。Blazor Server模式的最大优势是——所有代码都在服务端运行。前后端天然统一:不需要写两套代码、处理CORS、维护API接口实时通信开箱即用:SignalR自动管理WebSocket连接流式输出天然支持。

2026-01-17 22:08:38 2497

原创 告别命令行“黑箱“!Open Claude Cowork:让AI代理可视化协作的革命性桌面应用

ClientEvent(客户端事件)和ServerEvent(服务端事件)。// 客户端 -> 服务端事件cwd?: string;// 服务端 -> 客户端事件title?: string;cwd?: string;error?: string;类型安全:TypeScript的类型系统确保了事件的结构正确性清晰的职责划分:客户端负责发起操作,服务端负责执行和反馈易于扩展:新增功能只需要添加新的事件类型**真正的"零配置迁移"**:复用,不需要在另一个地方再配置一遍双向互通。

2026-01-17 21:44:30 1698

原创 踩坑三周,我终于把 Claude Code 和 Codex 塞进了浏览器— 一个让手机也能写代码的疯狂想法

《在地铁上写代码:一个移动端AI编程助手的诞生》讲述了作者如何开发一款能在手机上远程调用AI编程工具的项目。文章详细记录了从灵感萌发到技术实现的完整过程,包括采用Blazor Server解决流式输出难题、适配器模式统一不同CLI工具接口、IndexedDB实现本地会话存储等关键技术方案。特别分享了移动端适配的44px触摸优化、工作区隔离的安全设计等细节经验,并坦承了处理JSON边界情况、Windows只读属性等踩坑经历。该项目突破了传统编程工具必须依赖电脑的限制,让开发者能随时随地通过浏览器进行编码工作。

2026-01-15 17:36:21 2377

原创 手机上写代码、做PPT、分析Excel?这款“AI 全能工作台“让我随时随地都能工作

工作这件事,本来就不应该被设备和场景限制。躺沙发上突然想到一个好点子?掏出手机让 AI 帮你实现地铁上 review 代码发现问题?直接让 AI 修复咖啡馆里想起 PPT 没做?打开网页几分钟搞定这才是我理想中的工作方式。场景能力📝编程写代码、改 bug、code review、重构优化📊数据Excel 分析、图表生成、数据处理📑文档PPT 制作、Word 编辑、PDF 处理🎨设计UI 优化、海报设计、艺术生成🧪测试自动化测试、截图对比、日志分析所有这些,只需要一个浏览器。

2026-01-14 17:22:54 1847

原创 手机上写代码、做PPT、分析Excel?我用 Blazor 搞了个“AI 全能工作台“,踩坑无数终于跑通了

摘要:本文分享了一个基于Blazor开发的手机端AI全能工作台项目,让用户可以通过浏览器远程调用AI完成编程、数据分析、PPT制作等任务。项目采用适配器模式解决不同CLI工具的兼容问题,通过分层缓存和防御性编程优化性能,并集成16个官方Skills实现多场景应用。作者详细介绍了技术选型、架构设计中的关键决策,以及移动端适配、进程管理等实践中的坑与解决方案。该项目将云端编程助手升级为AI全能工作台,支持随时随地通过手机完成代码编写、Excel分析、PPT制作等复杂工作。

2026-01-14 16:33:49 1967

原创 深度解析Claude Agent Skills:我是如何理解AI能力模块化这件事的

研究Skills这三天,我最大的收获不是学会了怎么写YAML或者怎么组织文件,而是重新理解了AI应用开发的本质。我们不是在"调教"AI,而是在为AI设计工作环境。就像你不会把新员工扔进办公室说"自己看着办",而是会:给他岗位说明书(SKILL.md)提供工具和模板(scripts/assets)准备参考资料(references)告诉他遇到问题该查什么(明确的引用)Skills的设计哲学完美诠释了这一点。另外,我越来越觉得**AI应用开发正在从"艺术"走向"工程"**。

2026-01-14 11:19:38 1848

原创 用上这个Skill,你的Claude Code/Codex 将会比别人快5倍 -- 用分布式思维驯服AI任务编排

本文探讨了一种优化AI任务执行效率的新思路——将分布式系统理念应用于AI任务编排。作者发现传统"单线程"使用AI的方式存在效率低下、输出混乱等问题,提出通过任务分解、并行执行和结果聚合的三步法来提升效率。核心在于将复杂任务拆分为独立原子任务,由多个"虚拟Agent"并行处理,最后统一整合输出。文章详细介绍了四阶段工作流设计、三种依赖关系处理模式以及三层容错机制,并通过代码审查、文档翻译等案例展示了3-4倍的效率提升。作者强调这不仅是一种技术方案,更是一种结构化解决问题

2026-01-13 14:04:50 3033

原创 踩坑三个月,我用 Blazor 重构了一个 AI UI 协议,这些教训值得你看看

本文分享了作者在实现A2UI协议的Blazor版本时遇到的技术挑战和解决方案。文章重点探讨了七个关键问题:声明式UI设计解决了AI生成界面的安全性问题;数据绑定系统的三层解析机制;消息驱动架构确保状态一致性;处理JsonElement类型的坑;利用Blazor的DynamicComponent实现动态渲染;可配置主题系统的设计;以及性能优化策略。作者还提出了未来改进方向,包括扩充组件库、支持SSR等。整个项目从最初的不确定性到最终实现,展现了架构设计的重要性,为类似动态UI项目提供了宝贵经验。

2026-01-11 21:29:35 3295

原创 痛定思痛:我花了一个月重构 AI 助手,只为了解决这三个问题

本文分享了重构AI助手Kode的设计思考与实现细节,重点解决了多模型协作、智能补全、流式架构等核心问题。通过模型指针系统实现运行时切换,采用混合算法优化补全体验,利用AsyncGenerator提升交互流畅度。文章还探讨了Subagent上下文隔离、MCP工具集成等高级功能,并总结了性能优化和跨平台兼容的实践经验。最后展望了上下文压缩、本地模型支持等未来方向,为AI助手开发提供了实用参考。

2026-01-10 20:56:32 1762

原创 想用 GPT-5-Codex 却被 Response API 劝退?Response2Chat 一键转换,让你用 Chat 协议畅玩最新模型!

Response2Chat是一个轻量级代理服务,它能将gpt-5-codex、gpt-5-pro等使用ResponseAPI协议的模型转换为标准的ChatAPI格式,实现与现有工具链的无缝对接。该项目采用FastAPI+httpx技术栈,仅700行代码就完成了包括流式响应、工具调用、多模态支持等复杂功能。通过协议转换层,开发者无需修改现有代码即可使用最新模型,解决了GPT-5系列与ChatAPI不兼容的痛点。支持Docker快速部署,适用于开发工具升级、统一AI网关等多种场景,是连接新旧AI模型生态的理想桥

2026-01-09 11:41:27 5626

原创 Claude Code深度解析:当AI不再是“代码生成器“,而是你的技术合伙人

ClaudeCode:重新定义AI编程助手的"技术合伙人" 摘要: ClaudeCode颠覆了传统AI编程工具的概念,从"代码补全助手"进化为"技术合伙人"。其核心创新在于代理系统(Agentic System)设计,能够主动提问、并行分析、协作决策。通过插件架构、Hook系统和多代理协作机制,ClaudeCode实现了从需求分析到代码审查的全流程智能化支持。实际案例显示,其可将复杂功能开发时间从3-5天缩短至4小时,同时保证代码质量。相比GitH

2026-01-08 16:19:19 6300

原创 价值20亿美元的秘密:让AI不再“失忆“的工作记忆法

《AI代理如何避免"遗忘":20亿美元收购背后的文件管理智慧》 Meta以20亿美元收购的AI公司Manus揭示了一个简单却革命性的解决方案:教会AI"记笔记"。传统AI助手在执行复杂任务时存在致命缺陷——随着操作次数增加,会逐渐遗忘初始目标。Manus通过创建三个Markdown文件(task_plan.md记录任务计划,notes.md存储研究发现,[deliverable].md作为最终交付)完美解决了这个问题。 这种文件系统作为"外部大脑"

2026-01-07 00:26:33 3064

原创 打破AI编程的围墙:Claude Code Router如何让你用上“买不起“的顶级AI助手

《ClaudeCodeRouter:用开源技术打破AI编程助手的地域壁垒》 摘要:当Anthropic发布ClaudeCode编程助手时,地域限制和高昂费用让许多开发者望而却步。ClaudeCodeRouter应运而生,这个开源项目通过逆向工程发现了环境变量重定向的突破口,实现了用自有模型驱动ClaudeCode的技术方案。项目采用Node.js+TypeScript构建,核心创新包括:1)智能路由系统,根据任务特性动态选择最适合的模型;2)Transformer模式,处理不同模型提供商的格式差异;3)内置

2026-01-03 14:12:56 1726

原创 打破AI调用壁垒:Antigravity Tools如何用Rust+Tauri重构你的AI工作流

摘要:AntigravityTools是一个基于Rust和Tauri的开源AI调度系统,旨在解决多AI账号管理和协议转换难题。它支持OpenAI、Claude、Gemini等主流AI协议,通过本地化代理服务实现智能调度和配额管理,显著降低使用成本。该项目采用分层架构设计,包含协议转换、智能调度和故障处理等模块,性能优异(P50延迟45ms),内存占用低(80MB)。AntigravityTools不仅提升了开发效率(用户反馈成本降低90%),还注重隐私保护,所有数据均本地处理。社区驱动的发展模式使其快速迭代

2026-01-03 12:31:42 2491 2

原创 当AI遇上PPT:揭秘ALLWEONE演示文稿生成器的技术魔法

《ALLWEONE AI演示生成器:开源PPT制作新方案》 摘要:ALLWEONE是一款基于现代Web技术栈的开源AI演示文稿生成工具,通过三层架构设计实现从主题输入到精美演示的一站式解决方案。项目采用Next.js+TypeScript技术组合,集成AI内容生成、9套可定制主题和Plate.js富文本编辑器,支持流式生成和多语言输出。其核心创新在于结构化提示词工程和插件化设计,使AI能够智能选择15种专业布局并生成详细配图建议。相比商业竞品,ALLWEONE在开源可控性、隐私保护和本地模型支持方面具有优势

2025-12-29 17:53:49 2745 1

原创 当AI遇见UI:用.NET Blazor实现Google A2UI协议的完整之旅

Google推出的A2UI协议为AI生成用户界面提供了创新解决方案。本文详细解析了基于.NET9 Blazor的A2UI实现,其核心优势在于:1)通过JSON数据而非代码生成UI,确保安全性;2)采用声明式设计,实现跨平台原生渲染;3)优化LLM友好性,使用邻接表结构。文章深入剖析了四层架构设计、18+标准组件实现、数据绑定机制和主题系统,并展示了餐厅预订助手的完整应用案例。相比传统方案,A2UI在安全性、可移植性和AI友好性方面具有显著优势,为AI时代的UI开发提供了新范式。

2025-12-28 23:36:10 2467 1

原创 2025年度技术之旅:在AI浪潮下的个人突破、持续创作与平衡之道

2025年技术成长与创作回顾:本文总结了一位技术博主在AI变革浪潮中的年度收获。作者从三个方面展开:1)个人成长方面,深度实践AI工具,提升编程效率100%,获得微软MVP等多项专家认证;2)创作历程上,全年发布432篇博客,粉丝增长至1.4万,内容聚焦AI应用与云原生;3)生活平衡方面,采用模块化时间管理,将创作定位为"学习副产品",追求可持续输出。展望2026年,作者计划深耕AI Agent领域,推动技术实用化,并优化生活工作平衡。文章展现了技术人在快速变革时代的成长方法论与生活哲学

2025-12-28 22:15:59 2817 2

原创 当AI遇见UI:A2UI协议在.NET Blazor中的完整实现与深度剖析

本文深入探讨了A2UI协议在.NET9 Blazor中的实现,提出了一种让AI安全生成用户界面的创新方案。传统AI生成UI面临安全性、跨平台适配和体验一致性三大挑战,A2UI通过声明式UI协议完美解决:AI只需发送UI"意图"数据,由客户端原生组件渲染实现。文章详细解析了四层架构设计、核心协议实现和组件系统,展示了如何通过扁平化组件树、三种数据绑定模式和流式处理实现高效渲染。同时介绍了Fluent API、主题系统和实战应用场景,对比了与传统方案的差异,并提供了性能优化和安全实践建议。该

2025-12-28 13:38:54 2481

原创 当AI开始“画“界面:A2UI协议如何让.NET应用告别写死的UI

Google A2UI协议在.NET Blazor中的实现探索 本文介绍了Google A2UI协议在.NET Blazor中的开源实现,探讨了这一创新技术如何通过声明式JSON协议实现AI生成动态UI。文章详细解析了技术架构的五层模型和核心组件,包括15+预定义组件及其交互机制。通过多个实战场景展示了该技术在智能客服、数据可视化等领域的应用潜力,并提供了集成真实LLM的方法和性能优化建议。同时,文章也探讨了安全考量和工程化落地策略,指出A2UI代表了一种从"实现UI"到"定义

2025-12-28 13:08:05 2461

原创 AI驱动的智能研究助手:从零到一打造人机协作的研究画布

摘要:本文介绍了一款名为open-research-ANA的智能研究助手系统,它通过LangGraph状态机架构实现了高效的人机协作研究流程。系统集成了实时搜索、大纲生成和内容写作等功能,采用Tavily搜索引擎和GPT-4模型,支持多查询并发和流式内容输出。其创新之处在于采用Human-in-the-Loop设计理念,通过中断机制确保用户始终掌握研究主导权。前端采用Next.js实现分屏交互界面,支持实时状态显示和本地存储。该系统可应用于学术研究、市场调研等多个场景,显著提升研究效率,展示了AI增强而非取

2025-12-25 22:15:09 5521

原创 当数据分析遇上AI:airda让你用聊天的方式玩转SQL

AirDataAgent(airda)是一个面向数据分析的多智能体系统,通过自然语言处理技术实现从用户提问到SQL查询的自动转换。其核心价值在于降低数据分析门槛,让非技术人员也能轻松查询数据。系统采用分层架构设计,包含框架层、智能体层和应用层,通过RAG技术和向量检索实现表结构智能匹配。airda的工作流程分为需求确认、任务规划、任务执行和结果交付四个步骤,支持多智能体协作完成数据查找、SQL生成、代码编写和可视化展示。目前支持MySQL数据源,未来计划扩展更多数据库类型并增强业务知识理解能力。该项目展现了

2025-12-25 22:03:15 5515 1

原创 当AI Agent学会“打电话“——微软Agent Framework的A2A与AGUI协议深度解析

微软AgentFramework通过A2A和AGUI协议实现了AI智能体之间的高效协作,构建了类似微服务的分布式AI系统。A2A协议定义了智能体间的通信标准,支持异步任务和上下文保持;AGUI协议则规范了智能体与客户端的交互,支持混合执行模式。这种架构将复杂功能分解到专业智能体,通过标准协议协同工作,既提升了系统扩展性,又降低了维护成本。框架采用.NET实现,提供流式响应、任务续传等特性,适用于从简单查询到复杂协作的各种场景。未来,这种智能体网络架构有望推动AI应用向更模块化、可互操作的方向发展。

2025-12-24 21:45:21 5739 2

原创 AgentFramework:生产环境清单

本文提供了一份AI代理上线前的完整检查清单,涵盖安全、性能、可靠性等关键维度。安全方面强调密钥管理、数据保护和网络安全;性能检查包括优化策略和资源配置;可靠性涉及错误处理和容错能力。同时详细说明了监控告警配置方法,包括日志记录、指标收集和告警规则设置。最后提出运维最佳实践,包括蓝绿部署、备份恢复策略和定期维护任务。通过这套系统化方案,确保AI应用在生产环境中的稳定运行,并实现持续优化。

2025-12-21 23:41:53 5549

原创 AgentFramework:测试方法

本文系统介绍了AI应用开发中的测试方法与实践。主要内容包括:1)单元测试(使用xUnit框架测试工具函数、输入验证等核心功能);2)集成测试(验证与AI服务交互、工具调用等真实场景);3)测试最佳实践(AAA模式、单一职责测试、覆盖率目标等)。通过代码示例展示了如何构建有效的测试体系,强调测试不仅能提前发现问题,还能作为代码文档。文章还提供了持续集成配置方案和测试检查清单,帮助开发者建立完整的质量保障机制。

2025-12-21 23:41:10 5799

原创 AgentFramework:错误处理策略

本文系统介绍了AI代理应用开发中的错误处理策略,包括四种常见错误类型(网络、API、输入和系统错误)及处理原则。重点阐述了异常捕获、错误分类、重试机制和断路器模式等关键技术,并提供了完整的C#代码示例。文章还提出了包含自定义异常、中间件、日志记录和监控告警的完整错误处理框架,最后给出部署前的检查清单,强调优雅处理错误对保障应用稳定性和用户体验的重要性。

2025-12-21 23:40:22 5341

原创 AgentFramework: 安全最佳实践

本文详细介绍了开发AI代理应用时的安全最佳实践。重点包括:1)API密钥管理(避免硬编码、使用环境变量或KeyVault);2)数据保护策略(敏感信息脱敏、加密存储、访问控制);3)输入验证(检查长度、速率限制、恶意内容检测);4)输出清理(移除危险内容)。文章提供了具体代码示例和安全检查清单,强调安全性是持续过程而非一次性工作。通过实施这些措施,可以有效保护API密钥、用户数据和应用安全。

2025-12-21 23:39:38 5346

原创 Agent Framework:性能优化

本文介绍了AI代理应用的性能优化策略,包括7个关键优化点:减少API调用次数、使用缓存策略、优化提示词长度、采用流式响应、并行处理请求、限制对话历史和选择合适的模型。文章提供了具体代码示例和性能测试方法,展示了一个客服案例优化前后的显著差异:响应时间从8.5秒降至2.1秒,成本降低60%,并发能力提升400%。作者强调性能优化应遵循测量优先、逐步改进的原则,在性能、成本和质量间取得平衡。

2025-12-21 23:38:55 5477

原创 AI Agent 的“技能树“:Agent Skills 如何让 AI 从“万金油“变成“专家“

摘要:Anthropic开源的AgentSkills是一个让AI智能体获得专业技能的开放标准。该标准通过简单的文件夹结构(核心是SKILL.md文件)定义技能,采用渐进式加载设计,包含技能目录、说明书和资源包三个层次。相比传统AI训练方式,AgentSkills实现了从"训练"到"装备"的转变,使AI在保持通用能力的同时获得专业深度。其优势在于简单性、可扩展性、互操作性和透明性,特别适合企业流程标准化、团队工具链统一等场景。虽然仍面临技能发现准确性、安全性等挑战,但作

2025-12-21 23:34:39 5835

原创 A2UI与AG-UI深度对比:两大AI界面协议的异同与选择

摘要:A2UI与AG-UI协议对比解析 A2UI(Google开源)与AG-UI(CopilotKit团队开源)是两类功能迥异的AI协议: A2UI:专注UI生成,通过声明式JSON描述界面结构,支持跨平台渲染(Web/移动端),采用白名单机制保障安全性,适用于表单、数据展示等场景。 AG-UI:提供智能体交互协议,标准化消息、状态、工具调用等实时通信,适配LangGraph等主流框架,适合全功能智能体应用开发。 两者可独立或组合使用(如AG-UI传输A2UI的UI描述),选择取决于需求: 优先A2UI:跨

2025-12-21 22:56:56 5940

原创 从Agent视角看A2UI:智能体终于学会了用界面“说话“

A2UI协议为智能体带来界面生成能力革命,使其从单一文本交互升级为多模态UI交互。核心优势包括:1)表达能力突破,支持生成卡片、表单、图表等丰富组件;2)交互效率提升,通过智能预填和渐进式引导优化用户体验;3)跨平台兼容性,统一JSON格式适配各类终端;4)安全沙箱机制,确保组件生成的安全性。该协议使智能体能根据上下文动态生成最适合的界面,大幅提升任务完成率和用户满意度,代表AI交互方式的重大升级。

2025-12-21 22:32:45 5920

原创 当AI学会“画“界面:A2UI如何让智能体拥有UI表达能力

摘要:Google开源的A2UI项目创新性地解决了AI生成交互界面的安全难题。该协议采用声明式JSON格式,通过邻接表模型实现流式UI生成,支持数据绑定和模板机制,既能保证安全性(白名单组件、无代码执行),又能提供丰富的交互体验。A2UI具有跨平台特性,同一份JSON可在Web、Flutter等多平台渲染,适用于动态表单、数据可视化等场景。相比直接生成代码的方案,A2UI在安全性和可维护性上优势明显,为AI时代的动态界面生成提供了标准化解决方案。

2025-12-21 22:23:09 3394

原创 当AI遇上字幕:一个让视频“开口说话“的智能助手是如何炼成的

VideoCaptioner这个项目,表面上是个字幕处理工具,实际上是一个AI工程化的优秀范例。AI不是银弹:LLM很强大,但需要工程手段约束(Agent Loop、验证机制)性能优化无止境:缓存、并发、批量处理,每个细节都能提升体验用户体验第一:再强的技术,包装不好也没人用开源的力量:一个人的创意,可以惠及成千上万的用户如果你也在做AI应用开发,不妨参考这个项目的设计思路。好的工程不是炫技,而是把复杂的事情做简单,把简单的事情做极致。项目地址Star数:持续增长中(写这篇文章时已经破千)适合人群。

2025-12-19 17:41:27 5585

原创 解密Anthropic的MCP Inspector:从协议调试到AI应用开发的全栈架构之旅

MCPInspector是Anthropic开源的AI开发调试工具,用于可视化调试ModelContextProtocol(MCP)。该工具采用现代化技术栈(React+TypeScript+Vite+TailwindCSS)构建,支持stdio、SSE和HTTP三种传输协议,提供OAuth流程调试、动态表单生成等功能。文章详细剖析了其Monorepo架构、代理模式设计、安全防护机制和性能优化策略,并分享了开发最佳实践和扩展方法。MCPInspector不仅解决了MCP协议调试难题,还展示了专业级开发者工具

2025-12-19 17:24:07 4943

原创 Sim.ai:开源AI工作流编排平台的技术革命——从可视化设计到生产级部署的完整实践

Sim.ai是一款开源的AI工作流编排平台,采用现代化的技术栈(Next.js16、Bun、PostgreSQL)构建。其核心特性包括可视化DAG工作流编排、多模型支持(OpenAI/Claude/Gemini等)、100+工具集成、实时协作和本地模型部署。平台通过优雅的架构设计实现了高效的并行执行、变量解析和错误处理机制,并内置RAG、人工审核等企业级功能。作为Apache2.0开源项目,Sim.ai既支持自托管保障数据隐私,也提供云服务选项,特别适合构建智能客服、自动化流程等AI应用。相比Zapier/

2025-12-15 22:43:49 5634 2

原创 当AI遇上视频剪辑:一个让你“躺平“的智能剪辑系统

AI视频剪辑系统Ai-movie-clip通过AI技术实现智能视频剪辑,能自动分析视频内容并生成剪辑方案。该系统具备视频理解、语音处理、AI决策和视频编辑等核心功能,采用模块化架构设计,支持多片段智能组合和语音时间戳等创新技术。适用于会议记录、Vlog制作、产品宣传等多种场景,可大幅提升剪辑效率。项目开源免费,开发者可贡献代码或进行二次开发。虽然不能完全替代专业剪辑,但能处理80%的重复性工作,让用户专注于创意部分。未来将向更智能的内容理解、创作能力和行业定制化方向发展。

2025-12-14 22:55:31 5359

AntSK0.6.6 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net9+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2025-10-06

AntSK0.6.5 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net9+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2025-06-22

AntSK0.6.2 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2025-03-04

AntSK免安装部署版(需要.net 8 SDK环境)

AntSK是一个可以运行本地/在线大模型的 AI知识库项目

2025-01-13

AntSK0.5.1 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2024-09-30

AntSK0.5.0 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2024-08-22

Deep Learning Tutorial

人工智能学习文档 Deep Learning Tutorial 适合新手学习

2017-12-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除