• 博客(5985)
  • 收藏
  • 关注

原创 秒级弹性!探索弹性调度与虚拟节点如何迅速响应瞬时算力需求?

本文将介绍弹性调度如何使用虚拟节点来满足您的业务弹性需求。

2024-02-20 15:57:21 420 1

原创 解读 EventBridge Transform,数据转换和处理的灵活能力

阿里云 EventBridge 提供了强大而灵活的事件总线服务,它可以连接应用程序、阿里云云服务和阿里云 Serverless 服务来快速构建 EDA(Event-driven Architectures)事件驱动架构,驱动应用与应用,应用与云的连接。除此之外,它还可以作为流式的数据管道,在不同的数据仓库和数据处理或分析程序之间快速构建 ETL 系统。

2024-02-19 16:28:42 575 1

原创 从 13 个企业关心的问题看懂用云范式的改变

今天,容器和 K8s 已经成为应用研发运维的新标准,行业调研数据显示,2022 年有 64% 的最终用户在生产环境中使用了 K8s;2022 年托管在云上的 K8s 集群增速达到了 127%。我们也看到云托管的 K8s 将在 2023 年超过本地部署。这意味着容器化上云成为了新常态。

2024-02-19 10:14:42 723 1

原创 Sentinel 新版本发布,提升配置灵活性以及可观测配套

在功能上主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。同时 Sentinel 将会在未来的 2.0 系列版本中,进一步支持流量路由、流量染色与标透传、异常流量调度、预热调权等能力。在生态对接以及使用方式上也会更加贴近云原生。

2024-02-05 10:16:30 941 5

原创 成本更低、更可控,云原生可观测新计费模式正式上线

可观测作为企业 IT 运维必须品,在应对不同可观测场景时提供了非常多产品,以及与之对应的计费模式,供企业灵活选择。但如果产品价格说明不完整且不能有效评估现有业务规模及增长趋势,就会给企业带来非常高的成本规划与选型评估门槛。

2024-02-04 15:37:53 1093 2

原创 进击的 Serverless:Java 应用如何从容地面对突增流量

移动互联网时代,许许多多的业务都有着流量的周期性变化,无论是直播、游戏、点单系统、电商平台等等,都会存在着流量的高峰与波谷。如果采用固定的计算资源部署服务,使用的多了,大量资源在流量波谷闲置浪费,使用的少了,服务难以抗住高峰期的大规模流量,易带来业务损耗。

2024-02-01 17:26:08 897

原创 走出大模型部署新手村!小明这样用魔搭×函数计算

前文介绍了魔搭 ModelScope 社区模型服务 SwingDeploy 服务。开发者可以将模型从魔搭社区的模型库一键部署至阿里云函数计算,当选择模型并部署时,系统会选择对应的机器配置。按需使用可以在根据工作负载动态的减少资源,节约机器使用成本。5 分钟完成从开源模型至模型推理 API 服务的生产转换…

2024-02-01 10:23:21 699

原创 基于 Megatron-Core 的稀疏大模型训练工具:阿里云MoE大模型最佳实践

随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。

2024-01-31 16:19:36 632 1

原创 十年后数据库还是不敢拥抱NUMA - 续篇

写这个续篇是我收到很多解释,因为跨Node 导致性能抖动,所以集团在物理机OS 的启动参数里设置了 numa=off ,也就是不管BIOS 中如何设置,我们只要在OS 层面设置一下 numa=off 就能让程序稳定下来不再抖了!

2024-01-31 14:14:03 935

原创 PolarDB-X 最佳实践系列(四):如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。

2024-01-30 17:57:00 799 1

原创 云原生离线工作流编排利器 - 分布式工作流 Argo 集群

通过分布式工作流 Argo 集群,您可以轻松编排工作流,每个工作流步骤使用容器运行,可以在短时间内轻松运行大规模机器学习、仿真计算和数据处理等计算密集型作业,也可以快速运行 CI/CD 流水线。

2024-01-30 16:40:30 776

原创 Consul 留给你的时间不多了

本文主要介绍了 HashiCorp BSL license 变更对于用户商业或生产使用带来的潜在风险,注册中心的选型对比,如何使用 MSE Nacos 替换 Consul 消除潜在的风险。

2024-01-30 14:55:18 823

原创 定向减免!函数计算让轻量 ETL 数据加工更简单,更省钱

业内较为常见的高频短时 ETL 数据加工场景,即频率高时延短,一般均可归类为调用密集型场景。此场景有着高并发、海量调用的特性,往往会产生高额的计算费用,而业内推荐方案一般为攒批处理,业务实时性会有一定的影响。

2024-01-29 14:50:31 653 1

原创 秒速出图!体验 TensorRT 加速 Stable Diffusion 图像创作

Stable Diffusion WebUI 是 Github 上最为热门的利用生成式 AI 进行图像生成的项目。它采用 ClipText 对文字进行编码,然后采用 UNet+Scheduler 在潜在表示空间上进行 Diffusion,最后采用 Autoencoder Decoder 将第二步生成的扩散信息再转为图像。

2024-01-29 14:27:02 763

原创 阿里云 SAE 2.0 正式商用:极简易用、百毫秒弹性效率,降本 40%

本文主要介绍阿里云 Serverless 应用引擎(以下简称 SAE )如何帮助企业跨越技术鸿沟,从传统应用架构无感升级到 Serverless 架构,以更高效、更经济的方式进行转型,快速进入云原生快车道,让 2 人的研发团队享受 2000 人技术团队的红利。

2024-01-29 10:53:10 1040

原创 3分钟畅玩!一键部署幻兽帕鲁联机服务器

《幻兽帕鲁》火爆,如何快速拥有一个可以跟小伙伴们愉快玩耍的服务器呢?本教程将指引您在阿里云上快速完成幻兽帕鲁专用服务器部署,仅需点几下鼠标,2~3分钟左右就能可完成搭建,全程无需手动配置参数。

2024-01-26 15:11:39 394 1

原创 魔搭×函数计算:一键部署,缩短大模型选型到生产的距离

面对魔搭 ModelScope社区提供的海量模型,用户希望快速进行选型并生产使用起来,但在此之前,却一定会面临算力管理难、模型部署难等一系列问题,那么能否实现快速把选定的模型部署在云端功能强大的 GPU 上,由云端负责服务,扩展,保护和监控模型服务,同时免于运维和管理云上算力等基础设施呢?

2024-01-25 17:26:50 976 1

原创 弹性调度助力企业灵活应对业务变化,高效管理云上资源

弹性调度的目标,就是帮助客户解决在使用云上弹性资源时面对的挑战。包括按照多级资源的优先顺序进行调度,以及按照定义的优先顺序进行缩容的能力。

2024-01-25 14:51:40 887

原创 可观测实践丨如何利用 AI 算法解决告警配置三大难题?

围绕小 A 遇到的三个问题,接下来给大家介绍更简单、精准的智能告警能力,手把手教小 A 配出“系统无异常时不误告,有异常时及时告”的高质量告警规则,完成公司最核心业务系统的稳定性保障任务。

2024-01-25 10:56:48 943

原创 从内核的视角观测容器 — SysOM 容器监控

容器化现阶段已经是构建企业 IT 架构的最佳实践。云原生容器化的部署架构,相较于传统 IDC 部署架构的 IT 架构方案,已经成为兼具高效运维及成本控制的业界事实标准。

2024-01-24 15:14:32 996 1

原创 Nacos 2.3.0 正式版发布,Nacos Controller 项目开源

借助于 Nacos Controller项目,我们可以将 Nacos 配置管理下移到 Kubernetes 集群中,又或是可以将 Kubernetes 中 ConfigMap 配置上移到 Nacos 控制台中,从而实现统一管理能力。

2024-01-24 14:13:58 942

原创 从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

安全一直是企业上云关注的核心问题。随着云原生对云计算基础设施和企业应用架构的重定义,传统的企业安全防护架构已经不能够满足新时期下的安全防护要求。

2024-01-23 16:11:19 843

原创 考试查分场景重保背后,我们如何进行可用性测试

不同于传统线下行业可模拟出对等的生产环境,在线教育/行业认证的压测难以实现同级别的服务集群。数据构造不真实、场景不符实际使用都会造成压测任务与真实场景的偏差。此外,压测工具缺乏安全性、人力成本、IT 成本投入大等问题亦亟待解决。

2024-01-23 15:19:18 971

原创 解密最受欢迎的开源 Serverless 框架:流量篇

对于 web 应用来说,通过请求流量的并发数、qps、rt 等指标,可以很好的衡量当前的 web 服务质量。Knative 中提供了基于请求驱动的 Serverless 能力,包括多版本管理流量,流量访问,基于流量的弹性以及监控等。本文从流量角度出发,为您解密 Knative 相关的能力。

2024-01-23 11:02:57 827

原创 Mixtral 8X7B MoE 模型基于阿里云人工智能平台PAI实践合集

本文介绍如何在PAI平台针对Mixtral 8x7B大模型的微调和推理服务的最佳实践,助力AI开发者快速开箱。以下我们将分别展示具体使用步骤。

2024-01-22 17:49:29 407

原创 Mixtral 8X7B MoE 模型在阿里云PAI平台的微调部署实践

阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学习平台,提供了对于 Mixtral 8x7B 模型的全面支持,开发者和企业用户可以基于 PAI-快速开始(PAI-QuickStart)轻松完成Mixtral 8x7B 模型的微调和部署。

2024-01-22 17:15:03 914

原创 调研 7 个开源项目后,这家数据合规平台如何构建高性能网关

当前我们的产品交付主要基于云原生相关的基础设施和开源技术栈,如 Kubernetes、Istio、Apache Dubbo、Alibaba Nacos 等,既支持以 SaaS 的方式提供开箱即用、标准、可配置化的产品服务,亦支持以混合云、私有云的方式进行私有化部署。

2024-01-18 16:25:54 843

原创 阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践

众所周知,随着时间的推移,算力成为了 AI 行业演进一个不可或缺的因素。在数据量日益庞大、模型体量不断增加的今天,企业对分布式算力和模型训练效率的需求成为了首要的任务。如何更好的、更高效率的以及更具性价比的利用算力,使用更低的成本来训练不断的迭代 AI 模型,变成了迫切需要解决的问题。

2024-01-18 11:04:09 853

原创 MSE Nacos:解决敏感配置的安全隐患

很多用户在使用 Nacos 的配置管理功能时,逐渐开始在 Nacos 中存储敏感数据。首先,用户自建的 Nacos 实例并未接入过多的安全防护,很容易受到安全攻击;其次,采用明文格式存储的敏感信息,很容易被窃取,给公司的信息安全带来了极大的隐患。

2024-01-17 16:13:31 895

原创 Nacos 在云原生架构下的演进

Nacos 提供的最核心能力是动态服务发现与动态配置管理能力,在云原生环境下,借助云产品,如 EDAS(企业级分布式应用服务)平台中,我们可以很轻松地使用 K8s 来托管 Nacos 体系的微服务应用,同时又享有全链路流量治理、可观测、极致弹性等能力。

2024-01-17 13:33:31 919

原创 Hologres V2.1版本发布,新增计算组实例构建高可用实时数仓

新增弹性计算组实例,解决实时数仓场景下分析性能、资源隔离、高可用、弹性扩缩容等核心问题,同时新增多种用户分析函数与实时湖仓Paimon格式支持,COUNT DISTINCT优化显著提升查询效率。

2024-01-16 16:01:04 423

原创 Hologres 实时湖仓能力增强,挑战5分钟加速分析OSS数据

5分钟快速使用Hologres实时湖仓能力,无需移动数据,直接加速读取存储于数据湖OSS上的Hudi、Delta、Paimon等格式类型的数据。

2024-01-15 15:27:56 956

原创 基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

随着AIGC技术的落地发展,越来越多的创新玩法闯进了我们视野,AI扩图便是其中之一。只需给AI一张图片,AI就会根据图像的上下文语义信息,预测和补充图像边界,生成一张尺寸更大的图像。AI扩图有时是拯救废片的神器,能够将半身照扩展为惊艳的全身照,有时也会翻车,生成的图像让人哭笑不得。

2024-01-15 14:46:32 1076

原创 如何画好一张架构图/业务图/流程图,掌握这4个关键点

今天的分享不是干货,是锦上添花的软技能。作为一个开发,日常工作中免不了要画一些图,无论是技术架构图还是业务流程图。基于个人的一些经验,分享一下我的作图方法,给大家一点思路提供参考,希望在未来的工作、生活中都能有所帮助。

2024-01-11 11:09:15 1006

原创 总结|性能优化思路及常用工具及手段

性能优化是降低成本的手段之一,每年大促前业务平台都会组织核心链路上的应用做性能优化,一方面提升系统性能,另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验,探讨一下性能优化的思路及常用工具及手段。

2024-01-10 17:27:27 1001 1

原创 曹操出行基于 Hologres+Flink 的实时数仓建设

在整个流程中,涉及到的数据将会在我们的业务系统中流转,主要包括有营销、订单、派单、风控、支付、履约这些系统。这些系统产生的数据将存储在RDS中,并进一步流入实时数仓中以进行分析和处理。最终数据会进入到不同的使用场景中,比如实时的标签,实时大屏、多维BI分析,还有实时业务监控以及实时算法决策。

2024-01-10 14:04:28 1563 2

原创 基于 PAI-EAS 一键部署 Stable Diffusion AIGC 绘画

教程中,您将学习如何使用阿里云模型在线服务(PAI-EAS)的预置镜像,快速部署AIGC Stable Diffusion SDWebUI绘画的AI-Web应用,以及启动WebUI进行模型推理。

2024-01-09 14:48:45 927 1

原创 奶茶上云,原生的更好喝

一年卖出 8 亿杯,考验的不仅是奶茶的品牌、口感和性价比,还得有一套打通线上和线下、连接上下游供应链、以保障丝滑购买体验的数字化系统。

2024-01-09 13:14:16 843

原创 阿里云云原生弹性方案:用弹性解决集群资源利用率难题

随着上云的认知更加普遍,我们发现除了以往占大部分的互联网类型的客户,一些传统的企业,一些制造类的和工业型企业客户也都开始使用云原生的方式去做 IT 架构的转型,提高集群资源使用率也成为企业上云的一致共识。大家上云的同时,开始思考有没有云原生的方法能更好地实现提高集群资源使用率这个核心目标。

2024-01-08 16:22:51 998 1

原创 云原生场景下,AIGC 模型服务的工程挑战和应对

“成本”、“性能”和 “效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。AI 领域的快速发展不仅需要算法的突破,也需要工程的创新。

2024-01-08 15:18:42 938

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除