◆ Amazon SageMaker 针对生成式 AI 模型提供更强的自动扩缩容能力
Amazon SageMaker Inference 推出一项新功能,可帮助客户减少生成式 AI 模型自动扩展所需的时间,从而改善生成式 AI 应用对需求波动的快速响应能力。
通过这一功能,客户可获得两个全新的高分辨率Amazon CloudWatch 指标-ConcurrentRequestsPerModel 和 ConcurrentRequestsPerModelCopy。客户可以基于这些指标,设计并创建自动扩展策略,当负载达到或超过到自动扩展策略中定义的阈值时,Amazon SageMaker 将在不到一分钟的时间内添加新实例或模型副本。
立即点击文末“阅读原文”,进入 Amazon SageMaker 页面开始使用,还有动手教程等你解锁!
星标不迷路,开发更极速!
关注后记得星标「亚马逊云开发者」
听说,点完下面4个按钮
就不会碰到bug了!