- 博客(82)
- 资源 (4)
- 收藏
- 关注
原创 Dify 官方上架 Nacos A2A 插件,补全双向多智能体协作能力
Nacos推出Agent Registry和A2A Discovery插件,提供统一的智能体注册发现平台,支持Nacos和URL两种发现模式,实现动态智能体选择和协作编排。该方案已在Dify插件市场上线,通过实践案例展示了如何构建多智能体客服系统,并整合了Nacos的企业级治理能力,为开发者提供高效的多智能体协作解决方案。
2026-01-27 16:40:49
908
原创 阿里云为何要将数据采集开发套件开源
本文探讨了数据采集在AI Agent系统中的核心作用,指出其正从运维工具演变为决定Agent品质的基础设施。作者从服务可用性、输出可靠性和成本控制三个维度分析,强调统一数据采集对构建端到端观测能力的重要性。阿里云开源的LoongSuite套件包含主机探针、进程级探针和采集引擎,支持多语言无侵入采集,具备全栈支持、生态兼容等特点。其核心组件LoongCollector通过All-in-One架构实现多维度数据统一采集,能完整还原Agent执行过程,为系统优化提供依据。
2026-01-16 18:54:39
1405
原创 AgentScope 支持 A2A + Nacos 驱动异构智能体互通
AgentScope 基于 A2A 协议与 Nacos Agent Registry,实现智能体的跨语言、跨框架协作与统一治理。企业落地 AI 应用时面临多语言栈协作、框架割裂、协议不统一等挑战。A2A 协议通过标准化消息结构和能力描述,支持不同技术栈的 Agent 互联互通。AgentScope 集成 Nacos 作为默认注册中心,提供开发部署全生命周期解决方案,支持服务发现、健康检查等功能。
2026-01-16 18:44:03
789
原创 告别传统 Text-to-SQL:基于 Spring AI Alibaba 的数据分析智能体 DataAgent 深度解析
从架构上,DataAgent 是一款基于 Spring AI Alibaba 生态构建的、面向企业级复杂场景的“虚拟 AI 数据分析师”。它通过 Spring AI Alibaba Graph & Agent Framework 构建了一套具备自我规划、工具调用、反思纠错及人类干预能力的数据智能体(Agent),通过 graph、multi-agent 模式将确定性流程与模型推理结合在一起,搭建了一套兼具流程确定性与智能化的数据智能体产品。
2026-01-15 14:36:12
645
原创 从注册中心控制台到云原生管控面,Dubbo 服务治理能力全新升级!
Apache Dubbo Admin 是一个用于更好地可视化、监控、治理 Dubbo 微服务应用程序的管控台。0.7.0 版本是一个以 Kubernetes 原生为核心设计目标的里程碑版本,标志着 Apache Dubbo Admin 从“注册中心管理控制台”,演进为云原生环境中的服务治理控制面(Control Plane)。
2026-01-15 09:00:00
690
原创 从 ReAct 到 Ralph Loop:AI Agent 的持续迭代范式
AI编程助手常因LLM的不可靠自我评估机制而“半途而废”,表现为过早退出、单次提示脆弱、高重试成本和上下文断裂等问题。Ralph Loop创新性地通过外部强制循环机制解决这一问题:将同一提示反复输入,让AI基于文件系统和Git历史持续迭代,直到达到客观完成标准。
2026-01-15 08:00:00
1763
原创 阿里 Assistant Agent 开源,助力企业快速构建答疑、诊断智能助手
Assistant Agent 是一个基于 Spring AI Alibaba 构建的企业级智能助手框架,采用代码即行动(Code-as-Action)范式,通过生成和执行代码来编排工具、完成任务。它是一个能理解、能行动、能学习的智能助手解决方案,可帮助企业快速构建智能答疑客服、系统诊断、运维助手、业务助理、AIOps 等智能体。
2026-01-14 20:00:00
605
原创 什么?我的狼人杀[特殊字符] 水平还不如 AI ?
AI狼人杀:随时可玩的社交推理游戏 摘要: 本文介绍了一款基于AgentScope开发的AI狼人杀游戏,解决了传统狼人杀需要多人参与的痛点。开发者通过7项核心技术实现AI玩家的真实互动:ReActAgent赋予AI持续思考能力;MsgHub实现信息隔离与广播;多智能体格式化器区分发言者;结构化输出确保决策明确;多Agent编排协调游戏流程;SSE实时推送更新游戏状态;Human in the Loop支持人类玩家参与。游戏采用Java开发,支持浏览器访问,提供不同角色的AI玩家,能像真人一样讨论、推理。
2026-01-14 15:56:02
1024
原创 AgentScope AutoContextMemory:告别 Agent 上下文焦虑
AgentScope推出的AutoContextMemory组件解决了智能Agent在长对话场景中面临的成本激增、性能下降等问题。该组件通过自动压缩、卸载和摘要对话历史,提供6种渐进式压缩策略,在保留关键信息的同时降低70%的API调用成本。采用多存储架构确保信息可追溯,支持跨会话持久化。实测显示,在代码分析等长对话场景中能显著提升响应速度并控制成本。
2026-01-14 15:22:40
723
原创 Nacos 安全护栏:MCP、Agent、配置全维防护,重塑 AI Registry 安全边界
Operant AI披露了首个针对Model Context Protocol(MCP)的"零点击"攻击"Shadow Escape",利用间接Prompt注入窃取数据。Nacos作为AI Registry平台,深度集成"安全护栏"功能,在MCP服务注册时进行自动化Tool定义扫描、Prompt注入检测和敏感数据审查,从源头防范风险。该功能支持自定义拦截等级和分模块拦截,适用于MCP配置发布和Server Prompt注入等场景,为AI应用生态提供
2026-01-14 15:14:59
964
原创 2025 智能体工程现状
摘要: LangChain发布的《State of Agent Engineering》报告显示,AI智能体在企业应用呈现快速增长趋势,57%受访者已将其投入生产环境。报告指出,大型企业引领智能体采纳浪潮(67%已部署),主要应用于客户服务(26.5%)和数据分析(24.4%)。质量(32%)、延迟(20%)和安全是当前主要挑战,而成本担忧下降。可观测性方案采用率达89%,多模型策略成为主流。与阿里云《AI原生应用架构白皮书》对比显示,国内外企业均聚焦智能体落地,客户服务和企业提效是最确定的应用场景。
2025-12-22 14:46:10
722
原创 HiMarket 重磅升级:Agent 的下一站,AI 开放平台
本文作者:赵恒、岛风、文想、彦林、于怀2025 是 Agent 元年,企业开始大规模落地 Agent,都会遇到多 Agent 管理,多 MCP 工具管理,多模型管理问题,如何查找和选择合适的 Agent/MCP/Model?哪些高频场景可以快速让所有人参与?多个团队如何协同,权限如何管理,成本如何分摊?
2025-12-22 13:36:30
888
原创 遗憾,Ingress NGINX 要退役了
Kubernetes社区宣布Ingress NGINX将于2026年3月正式退役,不再发布新版本或修复漏洞。作为早期流行的Ingress控制器,其维护困难和技术债务导致这一决定。对用户而言,将面临安全风险增加、运维负担加重等问题。官方建议迁移至Gateway API或其他替代方案,如阿里云MSE Ingress或Higress等,并提供了详细迁移指南。
2025-12-04 17:28:45
1146
原创 Hello AgentScope Java
AgentScope Java v0.2正式发布,为Java生态带来高代码Agent框架。该版本基于ReAct范式,通过分层架构实现多模态消息处理、工具调用和智能体协作。核心特性包括:透明化设计让开发者可修改提示词、监控API调用;钩子机制支持流程监控;支持会话持久化和结构化输出。示例展示了3分钟构建天气查询Agent的过程,并演示了多智能体协作能力。后续将推出RAG、Plan等增强功能,推进Serverless架构优化性能。项目已开源,欢迎开发者参与。
2025-11-21 13:14:09
1398
1
原创 森马如何用阿里云AI网关,轻松实现“AI+业务”高效落地
森马服饰通过阿里云AI网关实现AI业务快速转型,解决了模型管理、成本分摊、服务稳定性等挑战。该方案支持多模型统一接入管理,提供智能路由、安全管控和观测分析能力,使AI应用上线时间缩短50%,用户体验提升60%。基于Nacos3.0的注册配置中心实现了存量服务向MCPserver的无缝迁移。未来森马将深化动态路由和流量均衡能力,推动AI与设计、供应链等业务场景的深度融合,持续释放组织生产力。
2025-11-21 11:35:13
811
原创 评估工程正成为下一轮 Agent 演进的重点
在 AI 领域里经常提到一个词叫“品味”,这里讲的“品味”,其实就是如何设计评估工程,即对 Agent 的输出进行评价。如果没有评估,就很难理解不同的模型会如何影响我们的用例。
2025-11-04 10:16:21
608
原创 SOFA AI网关落地实践
SOFA AI网关是基于开源Higress内核构建的智能化网关解决方案,针对AI业务场景深度优化。它聚焦三大核心功能:1)作为智能体统一出入口网关,提供安全防护、流量管控和工具集管理;2)作为模型推理网关,支持语义缓存、内容安全和精细化限流;3)构建金融MCP市场,提供专业金融数据服务。该网关通过智能路由、统一接入等特性,有效解决了AI场景下的高延迟、资源消耗大等挑战,显著降低了模型接入复杂度,提升了智能体研发效率。
2025-10-28 14:18:52
886
原创 行业首发!Spring AI Alibaba + Nacos 支持分布式 Multi-Agent 构建
本文介绍了AI Agent从单智能体向分布式多智能体协作的演进趋势,并重点阐述了基于A2A协议的分布式构建方案。随着任务复杂度提升,分布式多智能体模式能更好地实现跨领域协作、提升系统可用性和安全性。Spring AI Alibaba与Nacos协同发布新版本,提供了开箱即用的Agent注册、发现与负载均衡能力。文章以"云边奶茶铺智能助手"Demo为例,展示了如何快速开发A2A Server/Client Agent,包括依赖引入、Agent定义等关键步骤,为开发者构建分布式多智能体
2025-10-28 14:03:21
974
原创 一等奖6万,Higress AI 网关开发挑战赛正式上线(附参赛指引)
摘要 Higress AI网关开发挑战赛由开放原子开源基金会主办,阿里云Higress社区承办,旨在推动AI原生网关技术创新。比赛聚焦三大方向:加速AI Agent构建、RAG增强和智能路由,要求参赛者基于云原生API网关Higress开发解决方案,解决AI领域前沿技术难题。参赛作品需在技术深度、理论依据和工程效果上达到领先水平,并通过集成Higress的开源插件生态,提升AI应用的开发效率和性能。比赛时间为2025年9月至12月,优秀方案将有机会丰富Higress的AI插件生态,推动AI基础设施的发展。
2025-10-21 14:04:56
695
原创 解读阿里云发布的《AI 原生应用架构白皮书》
阿里云在云栖大会上发布《AI原生应用架构白皮书》,系统解构AI原生应用的11大关键要素,包括模型、框架、工具等核心内容。白皮书由40多位工程师实践总结,获15位专家推荐,旨在推动AI应用标准化发展。随着大模型突破智能拐点,AI应用正从工具升级为智能助手,Agent技术逐步接管数字世界。白皮书指出,未来基于LLM编排的多智能体将成为主流方向,AI原生架构将与传统云原生架构协同演进。企业需聚焦高频场景、构建数据壁垒,通过模型优化巩固竞争力,加速AI应用落地。
2025-10-21 11:00:01
1010
原创 阿里云发布《AI 原生应用架构白皮书》
白皮书覆盖 AI 原生应用的11大关键要素,获得15位业界专家联名推荐,来自40多位一线工程师实践心的,全书合计超 20w 字,分为 11 章。
2025-10-13 17:01:44
1005
原创 Claude Code用不了? 使用 AI 网关迁移至任意模型
Anthropic宣布停止向中资控股企业提供Claude服务后,阿里云AI网关推出三步迁移方案,帮助开发者快速切换至国产大模型(如百炼Qwen3、智谱GLM3.5等)。
2025-09-11 14:11:59
1510
原创 基于 AI 网关的 LLM 高可用最佳实践
阿里云AI网关针对LLM服务的高可用性问题,提出综合解决方案。通过被动健康检测、首包超时机制和Fallback机制,有效应对流量突增导致的显存满载、服务崩溃等问题。
2025-09-11 11:22:09
733
原创 HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
Higress 社区与 Nacos 社区联合推出开源 AI 开放平台 HiMarket,旨在帮助企业快速构建 AI 能力市场。该平台提供管理后台、开发者门户、AI 网关和 Nacos 核心组件,支持企业将 AI 能力产品化,并统一管理开发者生态。
2025-09-02 14:03:37
1123
原创 释放 RAG 潜能,用 AI 网关帮助 Dify 应用“开外挂”
由于 Dify 内置 RAG 引擎在生产实践中的效果局限,许多 Dify 应用开发者期望能便捷的为 Dify 系统打通更多外部知识库,丰富 RAG 系统的选型。Higress AI 网关提供了快速打通外部 RAG 引擎的方案,将 Dify 的高效编排能力与专业 RAG 引擎的检索效能结合。通过帮助 Dify 应用“开外挂”,主要带来以下增益:效果跃升:通过集成 RAGFlow、百炼知识库 等专业引擎,显著提升知识分块质量与检索准确性。
2025-08-29 11:59:12
852
原创 不增加 GPU,首 Token 延迟下降50%|LLM 服务负载均衡的新实践
传统的负载均衡算法主要设计用于通用的Web服务或微服务架构中,其目标是通过最小化响应时间、最大化吞吐量或保持服务器负载平衡来提高系统的整体效率,常见的负载均衡算法有轮询、随机、最小请求数、一致性哈希等。忽略任务复杂度差异:LLM推理请求的复杂度差异极大。例如,一个长文本生成任务可能需要数十倍于短文本分类任务的计算资源。而传统负载均衡器无法感知这种差异,容易导致某些节点过载,而其他节点空闲,造成资源浪费和响应延迟。缺乏对GPU资源水位的感知。
2025-08-27 18:17:22
740
原创 携程旅游的 AI 网关落地实践
携程旅游研发总监董艺荃分享了大模型服务接入的实践经验。在应用 AI 技术过程中,携程面临多模型接入、费用管理和流量控制等挑战,最终选择 Higress 作为 AI 网关解决方案。
2025-08-25 13:22:18
1237
原创 Dify 性能瓶颈?Higress AI 网关为它注入「高可用之魂」!
随着 Dify 用户规模扩大、生产落地增加,Dify 应用在性能方面的问题也逐渐暴露,本文将介绍如何使用 Higress AI 网关保证 Dify 应用的全链路高可用性,并给出操作实践指南。
2025-08-19 17:33:32
1008
原创 进阶版|企业级 AI Agent 的构建实践
我们将构建 AI 应用扩展到了运行时和可观测,并尝试将 Agent、LLM、MCP 服务这几者之间如何有机协作尽量清晰化,未来还会扩展到Memory、LiteMQ 等更完整的技术栈,旨在帮助大家厘清完整的企业级 AI 应用构建的最佳实践。
2025-08-11 16:18:20
1239
原创 金融级 ZooKeeper 来袭:吞吐量提升100%,SLA 99.99%,数据防护升级
阿里云微服务引擎 MSE ZooKeeper 企业版正式发布,提供比专业版更高的稳定性与安全能力,SLA达99.99%,整体服务性能提升100%。针对关键业务,企业版通过独享资源池实现更高规格配额,满足大规模需求。此外新增数据备份容灾、容量管理反脆弱限流等功能,提升整体企业级特性,助力企业应对复杂业务挑战。
2025-08-06 10:04:01
952
原创 垂直和领域 Agent 的护城河:上下文工程
不同于上下文的修剪,压缩是更进一步的工程策略。当我们对上下文修剪完后,再对剩下的上下文进行压缩,把长文本压缩成语义密度更高的表达,进一步释放上下文空间,让模型能聚焦真正关键的信息。业内主流的压缩方式有:提取式压缩:直接从原始上下文中筛选出关键句子或段落,将它们拼接成新 prompt,不进行改写。实验室效果可实现高达 10× 的压缩比,同时几乎不损失模型准确性,在多类任务(单文档、多文档 QA、摘要)中表现比较好。优劣势包括保留原文措辞、信息可靠、输出质量高;操作低改动、执行路径简单。
2025-07-11 14:22:20
803
原创 20年金融投资数据沉淀,正式开放 MCP 能力
通过将底层数据资源进⾏全⾯梳理,今⽇投资推出了⾦融垂直领域的今⽇投资MCP市场,整合了包括⾦融基础数据、市场数据、⾏情数据、新闻资讯、研究报告等丰富的⾦融数据API以供调⽤,覆盖指数、板块、个股、基⾦等类型,助⼒专业和⼀般投资者的各种快速搭建⼤模型应⽤的数据需求。今⽇投资本次推出的今⽇投资MCP市场,旨在突破性地消除⾦融数据壁垒,助⼒市场中机构或投资者通过“MCP+⼤模型”的低⻔槛模式,快速构建出可⽤、可靠和好⽤的⾦融智能体,⽽不必担⼼数据难题,为⼤模型+⾦融证券应⽤的“最后⼀公⾥”提供强⼤数据⽀撑。
2025-07-09 14:41:44
1141
原创 Python语言从2.7到3.14的能力变化与演进逻辑
本文从编程风格、类库能力、性能优化、虚拟机技术、开发工具链等多个维度,阐明Python语言的各个版本间的能力变化,呈现一个尽量完整的Python演进视图。
2025-07-08 14:05:17
758
原创 Spring AI Alibaba 游乐场来啦!在线畅玩 AI 应用开发全流程
Play ground是基于Spring AI Alibaba框架搭建的AI应用平台,集成对话、图像生成、RAG、MCP等核心功能,提供完整的前后端实现。用户可通过在线体验地址(playground.java2ai.com)快速试用,或通过GitHub源码复刻定制化应用。
2025-07-08 13:43:03
1013
原创 Dify 开发者必看:如何破解 MCP 集成与 Prompt 迭代难题?
Nacos 与 Dify 的结合,为生成式 AI 应用的开发效率与架构灵活性提供了新的解决方案。
2025-06-30 15:26:11
888
原创 Nacos 3.0 架构全景解读,AI 时代服务注册中心的演进
比如:Nacos2.0中所有的HTTP API均使用8848端口, 这其中及包含了1.X客户端使用的API,也包含了运维人员以及控制台的API, 对于不同类型的API, 对于权限的需求其实是不同的,对于网络访问的连通性要求也是不同的。同时,AI Agent的应用广泛使用已是大势所趋, 随着越来越多的AI Agent的应用贯穿业务全线,Nacos能否帮助更好地管理AIAgent的应用,也是Nacos在当前的挑战,同时也是新的机遇。,也即AI应用与AI应用之间的发现与协作。
2025-06-30 14:20:47
1353
原创 0代码改动实现应用运行时数据库密码无损轮转
当前正在加速迈向AI时代,AI领域的安全问题也同样重要,比如Agent访问大模型LLM,MCP Server的配置也同样面临传统微服务应用中类似的安全性和易用性问题,Nacos会全面拥抱AI时代,面向应用侧提供一站式安全-易用-稳定的服务,配置,AI Registry平台。Nacos是国内被广泛使用的IT系统应用的配置中心,对于线上的IT系统应用,我们可以从多个方面来提升应用访问数据库帐密的安全性,比如增加密码的强度,帐密统一管理,设置访问权限,帐密传输加密等等,可以参考 《一.敏感数据的安全风险。
2025-06-30 12:03:24
813
原创 MCP 最新版本 9 大差异解读:授权机制、传输协议、批处理、工具元数据...
MCP Specification最新版本,相较于2024-11-05版本,主要更新包括:授权机制升级至OAuth 2.1,提升安全性;传输协议替换为Streamable HTTP,支持双向通信与断线恢复;JSON-RPC批处理强制支持,减少网络开销;新增Tool Annotations,提升工具可控性;支持音频数据流,扩展多模态能力;引入参数补全功能,提升开发效率;新增会话管理标识,增强长时任务可靠性;强制HTTPS与Token绑定,提升安全要求。这些更新显著提升了协议的安全性
2025-05-12 14:50:48
2057
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅