• 博客(24)
  • 收藏
  • 关注

原创 企业 AI 基础设施走向云边端协同:模型网关与算力调度如何支撑智能体落地

企业AI基础设施正从单一云端调用向云边端协同架构演进。模型网关作为治理中枢,统一管理多模型入口、路由、鉴权和计量;算力调度平台实现异构GPU资源池化,按任务需求智能分配云端、边缘和端侧算力。这种架构解决了数据隐私、低时延响应和成本优化等核心痛点,使强推理任务留在云端,敏感数据就近处理,最终形成高可用、可度量的AI资源底座,支撑智能体在多元场景下的高效协同与合规流转。

2026-05-26 11:08:25 384

原创 2026 中国多云管理平台发展趋势:AIOps、FinOps、信创与边缘计算

2026年多云管理平台迎来智能化升级,企业多云采用率达58%,但云预算浪费高达32%。八大趋势推动平台从资源纳管转向云服务运营中枢,包括异构统一纳管、AIOps自治运维、AI FinOps成本治理等。六大驱动力涵盖云资源形态扩张、AI工作负载增长、成本压力与合规要求。金融、制造等重点行业呈现差异化需求,如金融侧重合规审计,制造关注边缘协同。技术侧将实现统一视图与智能闭环,运营侧强调服务化与精细化。多云管理正从工具型平台向企业云运营基础设施演进。

2026-05-22 12:46:34 499

原创 如何给大模型集群选“大脑”?智算调度与管理平台 10 维选型指南(附选型评分表)

本文探讨了AI浪潮下智算中心面临的算力调度管理挑战,提出了"智算调度10维评估模型"作为选型参考。文章从算力调度平台的定义出发,分析了其核心功能包括资源池化、任务调度、计量计费等,并对比了企业级平台与轻量方案的适用场景。重点解答了6个常见选型问题,强调平台需适配国产芯片、支持模型网关和数据治理等能力。最后指出,有效的算力调度需要兼顾硬件异构性与业务需求,通过多维度评估才能确保智算基础设施的投资回报。

2026-05-21 17:27:07 344

原创 佳杰云星发布自研AI产品VClaw:打造企业数字员工通用入口,完善AI全栈布局

伟仕佳杰旗下佳杰云星发布自研AI产品VClaw,直击企业大模型落地痛点。该产品聚焦高频办公场景,具备一键部署、安全可控和深度适配三大优势,支持代码编写、数据分析等六大功能模块。通过构建"云-模型-智能体"三层架构,打通AI工程化落地全链路。目前已在政务、金融等领域落地200+案例,研发投入计划2026年翻倍,持续强化企业级AI产品矩阵,致力于成为亚太领先的全栈AI方案提供商。

2026-03-19 19:44:40 440

原创 让浏览器起飞的自动化测试工具playwright

微软开源的Playwright框架通过创新架构显著提升Web自动化测试性能与稳定性。该框架采用MCP架构直接与浏览器内核通信,执行速度比传统方案快30-50%,并支持Chromium、Firefox、WebKit三大引擎。核心优势包括:1)语义化定位(如getByRole)解决元素定位不稳定的痛点;2)支持Python同步和Node.js异步双模式;3)BrowserContext实现测试环境隔离。文章详细解析了安装配置、定位策略、实战案例及常见问题解决方案,特别针对异步编程、元素定位和HTTPS证书错误等

2026-02-14 10:00:00 1737

原创 测试工程师的AI外挂:Browser-use实战笔记

Browser-use是一款融合LangChain和Playwright技术的开源AI测试工具,通过CDP协议实现自然语言指令到浏览器操作的精准转化。文章详细介绍了该工具的架构原理、本地部署方法,以及GPT-4o与Qwen等大模型在测试场景中的性能对比。重点解析了三大实践要点:1)任务描述需采用动宾结构的精确指令;2)推荐使用带视觉能力的Qwen3系列模型;3)解决企业级HTTPS证书拦截等常见问题。该工具通过异步编程改造(Asyncio)实现了稳定

2026-02-13 10:00:00 1766

原创 解决LLM推理“脑裂”难题:Kubernetes LeaderWorkerSet(LWS)组件在大模型推理部署中的应用

摘要:Google开源的LeaderWorkerSet(LWS)解决了Kubernetes在LLM分布式推理场景中的痛点。传统Deployment和StatefulSet难以满足模型推理对Pod协同和弹性的需求,而LWS通过组级生命周期管理(1个Leader+多个Worker的副本组架构)、LeaderReady启动策略及独占拓扑功能,完美适配vLLM等框架。LWS支持原子化扩缩容、版本一致性保障和跨节点通信优化,已成为大模型推理部署的优选方案。算力调度平台已基于LWS构建LLM推理服务能力,实现快速弹性伸

2026-02-12 11:10:01 1014

原创 深度解析:Binpack调度策略在智算场景中的优势与作用

本文深入解析Volcano调度器中的Binpack装箱策略,针对云原生智算场景下的资源碎片化问题,提出通过"极致填充"策略提升算力资源利用率。文章详细介绍了Binpack的核心逻辑、多维度资源权重配置及评分算法,该策略优先将Pod调度到高负载节点,减少资源碎片,配合自动扩缩容实现降本增效。佳杰云星算力调度平台已集成该策略,并提供社区版免费试用,帮助用户解决异构算力统一管理难题,实现精细化资源调度。

2026-02-12 10:47:04 945

原创 佳杰云星:算力调度平台赋能东莞大模型中心,构建三方共赢数字生态

佳杰云星助力东莞构建人工智能大模型中心,通过自主研发的算力调度与运营平台,实现四大创新:统一纳管异构算力资源、打造一站式服务门户、开放生态合作、实施精细化运营管理。该方案有效解决了AI算力资源分布不均和运营模式缺失两大痛点,显著提升资源利用率和服务效率,构建起多方共赢的产业生态,为城市级AI公共服务平台建设提供可复制的实践范例。

2026-02-04 10:30:00 958

原创 佳杰云星“东莞大模型算力调度平台”入选“新质100”企业创新集群标杆案例

北京佳杰云星数据科技凭借"东莞人工智能大模型中心算力调度平台"项目入选2025年度"新质100"标杆案例。该平台通过统一纳管多芯片算力资源、集成50余种云服务,有效解决了AI算力分布不均问题,实现资源利用率提升30%、企业用算成本降低25%。项目构建了算力供应商-平台方-终端用户的三方共赢机制,为城市级AI公共服务平台建设提供了可复制的样板方案。未来公司将持续优化平台能力,助力国家算力互联网建设。

2026-02-03 14:15:43 399

原创 AppStage智能体及盘古大模型ModelArts Studio全生命周期管理,运营平台3.1.0版本发布

北京佳杰云星发布RightCloud云运营平台3.1.0版本,强化AI资产交易功能。新版本深度集成AppStage与ModelArtsStudio,支持盘古大模型全生命周期管理,包括资产上架、计费模式配置、资源池管理等功能。同时构建了基于Token的智能体运营体系,实现精细化计量计费。平台通过模型集市打造AI资产交易生态,提供供应商自助服务、定制化交付流程和促销功能,并配备数据驱动的运营大屏。该版本标志着平台从传统云资源运营转向"智算与模型运营"新阶段,支持异构平台统一管理。

2026-01-14 09:46:45 734

原创 从 Copilot 到工程化 Agent 执行框架:基于OpenCode + OpenSpec 的企业级 AI Coding 落地实践

摘要:本文探讨了AI编程从"Vibe Coding"向规范驱动自动化开发的范式转变。针对大型项目中AI编码存在的上下文丢失、代码混乱等问题,提出了OpenCode执行引擎与OpenSpec规范框架结合的解决方案。OpenCode作为任务编排引擎支持分步执行,OpenSpec通过提案-实施-归档三步工作流确保人机目标一致。实践案例展示了从需求提案到代码生成的全流程自动化,实现了开发效率提升50%、代码质量改善等显著成效。该方案标志着开发者角色从编码者向系统设计者的转变,为AI工程化应用提供

2026-01-13 18:45:57 5487

原创 深度解析|当 Prometheus 遇见大模型:解密下一代智能监控体系

本文探讨AI大模型如何赋能传统监控体系,实现从被动响应到主动预见的运维转型。传统Prometheus+Alertmanager组合存在滞后性问题,依赖静态阈值告警,无法预防故障。通过引入AI技术,可实现异常趋势预判、智能基线调整和根因分析等能力,构建"预见性运维"新范式。建议采取"存量优化+增量智能"策略,在现有架构上增加AI智能层,将指标、日志、链路数据关联分析,形成预测-干预-验证的学习闭环。AI并非替代现有工具,而是作为增强层提升运维效能,实现平滑演进。

2026-01-12 16:30:01 1185

转载 让AI用得起、管得住、用得好——理事单位佳杰云星的中小企业普惠AI之道

佳杰云星作为智算管理调度领域的先行者,致力于解决中小企业AI算力使用难题。公司提供全栈技术方案,包括异构算力调度、资产运营平台和AI应用开发工具,显著提升资源利用率并降低开发门槛。通过免费社区版软件和"AI for SME"普惠倡议,佳杰云星帮助中小企业突破技术和成本障碍。未来将重点发展智能体开发系统,推动行业AI生态建设,实现从国家超算中心到中小企业的算力普惠应用,让AI技术真正赋能各类企业。

2026-01-07 17:41:03 160

原创 如何低成本实现 GPU 算力池化?分享一套支持 DeepSeek 部署的算力调度社区版方案

随着大模型应用需求激增,中小团队面临异构算力管理难题。佳杰云星推出轻量化算力调度社区版,解决英伟达、昇腾等芯片统一纳管、成本高和利用率低等痛点。该方案源自企业级产品,已应用于多个智算中心和高校场景,并支持7个国家级AI算力平台。通过技术下沉,提供开箱即用的算力调度能力,助力科研团队和初创企业高效管理算力资源。目前平台已开放申请,提供部署指南和技术支持

2025-12-22 16:01:23 838 1

原创 ROI 实录:引入 AI Agent 后,我们的接口测试维护成本降低了 70%

本文探讨了基于LangGraph的自动化测试Agent系统的工程落地与商业价值。系统通过Checkpoint机制实现断点续传和状态管理,支持多会话并发测试。评估显示,该方案显著提升测试效率(75%)、降低维护成本(60-70%)并扩大测试覆盖率。相比传统方法,AI自主测试在成本、响应速度和测试广度方面优势明显。未来将探索多Agent协作模式,推动QA工程师向智能体架构师转型。该系统标志着API测试进入AI驱动的自主化新时代。

2025-12-18 18:07:44 872

原创 让 AI 自己修 Bug:揭秘测试 Agent 的“自我修正”与 Docker 沙箱实现

本文介绍了基于LangGraph的智能测试Agent的三大核心技术:1)通过分层提示和RAG技术生成可执行的Pytest代码;2)采用Docker容器作为安全隔离的执行环境;3)基于Reflexion机制的自我修正循环,能自动分析并修复测试代码错误。该架构解决了LLM生成代码的幻觉问题、环境一致性问题和错误自动修复问题,显著提高了测试自动化效率。文章还预告了下篇将探讨该系统的实际ROI效果。

2025-12-17 17:02:01 730

原创 抛弃脚本自动化:我们如何用 LangGraph 构建会“自我反思”的接口测试 Agent?

传统的 API 自动化测试正面临“脚本维护难、覆盖率低、工具割裂”的困境。佳杰云星技术团队基于 LangGraph 框架,构建了一套能够自动生成代码、沙箱执行并自我修正的 Agentic AI 测试系统。本系列文章将从架构选型、核心实现到效能评估,全方位复盘这一工程实践。本文为第一篇,聚焦痛点分析与架构决策。

2025-12-16 17:53:39 997

原创 从需求到上线:基于 Spring AI 打造“AI 问数”Agent 的完整实践

传统 BI 报表难以及时响应灵活多变的运营需求,而 Text-to-SQL(文本转SQL) 技术正是打破这一数据壁垒的关键。 本文将深度复盘 佳杰云星技术团队 如何基于 Java 生态(Spring AI Alibaba),从 0 到 1 构建生产级“AI 问数” Agent。文章将完整解析从解决大模型“幻觉”的 RAG 设计,到 SQL 执行的安全熔断,再到前端图表自动渲染的全链路代码实现与踩坑经验。

2025-12-15 17:16:41 1806 1

原创 拒绝算力裸奔!佳杰云星携手华为昇腾,解锁算力调度新范式

摘要:佳杰云星自主研发的AI算力调度管理软件正式入驻华为昇腾AI社区,旨在解决当前算力资源利用率低、异构芯片管理困难等问题。该软件具备三大核心能力:异构融合实现统一纳管、精细化调度提升资源利用率、MLOps全流程支持开箱即用。作为工信部首批认证厂商,佳杰云星与华为昇腾深度合作,推动国产算力实现"自主可控+高效调度"双保障。该方案已在昇腾社区上线,助力智算中心等用户降低使用成本,赋能行业智能化升级。

2025-12-11 15:40:12 1157 2

原创 异构算力调度深度解析:如何打破国产AI芯片的“利用率悖论”?

摘要:随着AI算力需求激增,智算中心面临异构管理复杂、资源利用率低、开发环境配置困难三大痛点。文章提出构建"算力操作系统"中间件的解决方案,通过逻辑池化、细粒度切分和MLOps自动化提升算力使用效率。以佳杰云星适配华为昇腾架构为例,展示了国产算力在统一纳管、虚拟化切分和环境封装方面的实践成果,为智算中心实现高效调度和国产化替代提供了技术路径。

2025-12-10 14:44:30 1305 2

原创 打破算力孤岛:构建“技术-产业-用户”闭环的大模型生态运营之道

孤举者难起,众行者易趋。大模型及AI智能体的可持续发展,离不开完善的生态体系。生态建设的核心是整合“技术供给方、产业应用方、用户”三方资源,形成“技术迭代-产业应用-用户反馈-技术优化”的良性循环。

2025-12-03 10:00:00 605 2

原创 拒绝“一锤子买卖”:大模型商业化模式创新与计费体系避坑指南

传统的一次性软件售卖模式,已难以适应大模型持续迭代、消耗算力的特性。AI智能体的商业化运营正朝着“服务化、订阅化、定制化”演进。如何设计商业模式?如何让客户为“看不见”的算力和Token买单?这是所有智算运营者必须解决的问题

2025-12-02 15:00:31 1068 2

原创 别卷参数!大模型下半场,AI智能体如何“杀”入政企核心场景?

本文探讨大模型与AI智能体在政企领域的商业化落地路径。文章从公众服务和企业服务两大场景切入,分析AI在政务服务、医疗健康、教育科普等民生领域,以及客户服务、生产制造、营销推广等企业场景的应用价值与运营关键。同时指出行业将呈现轻量化、行业化、自主化、合规化四大趋势,强调降低使用门槛、深耕垂直领域、强化智能决策和保障数据安全的重要性。文章为AI技术从实验室走向实际应用提供了场景化思路,为后续探讨商业模式奠定基础。

2025-12-01 17:57:25 903 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除