阿里云EMR2.0平台:让大数据更简单

阿里云EMR2.0平台在大数据处理方面实现了重大升级,包括弹性伸缩、稳定性、智能化和研发效能四个方面的优化。弹性伸缩支持时间与指标触发,支持抢占式实例,降低成本;稳定性提供节点故障容忍和补偿,全面服务巡检与事件通知;智能化的EMR Doctor能避免资源浪费,预警风险,提供实时分析建议;研发效能上,EMR Studio提供交互式开发和一键式作业调度,提升工作效率。
摘要由CSDN通过智能技术生成
摘要:本文整理自阿里云资深技术专家李钰(绝顶)在 阿里云EMR2.0线上发布会 的分享。本篇内容主要分为三个部分:
1.EMR 平台概述
2.EMR2.0 新平台核心能力
3.总结

一、EMR 平台概述

EMR 平台是开源大数据的云原生运行环境,阿里云EMR 根据云原生的特点,在弹性伸缩、稳定性、智能化和研发效能四个方面进行了大量的功能优化:

  • Elasticity 弹性伸缩,算力按需申请释放,突破IDC物理限制;
  • Stability 稳定性,故障节点自动替换补偿,关键事件自动告警;
  • Intelligence 智能化,智能探查资源浪费,预警集群潜在风险;
  • Efficiency 研发效能,业务高效开发调试,作业一键调度上线。

二、EMR2.0 新平台核心能力

Elasticity 弹性

基于时间的弹性伸缩能力

  • 弹性规则:定时增加或者减少 ECS 实例数量;
  • 适用场景:业务负载变化存在时间周期性;
  • 成本节省:通过采取这种策略,与预置固定资源相比可以节省大量资源;使用抢占式实例可以进一步降低成本;
  • 使用方式:在节点组上设置扩容规则的时候,选择按时间扩容;支持以下设置:执行频率和执行时间;规则的有效期;重试过期时间;单次扩容的节点数等。

基于指标的弹性伸缩能力

  • 弹性规则:通过预设的基于负载指标的规则,动态调整 ECS 实例数量;
  • 适用场景:业务负载动态变化,无固定时间周期性;
  • 成本节省:通过采取这种策略,可以动态的适应业务负载的变化;使用抢占式实例可以进一步降低成本;
  • 使用方式:在节点组上设置扩容规则的时候,选择按负载扩容;支持以下设置:集群负载指标(比如“YARN 资源队列 pending 应用数”);指标统计周期和统计规则;重复几次后扩容;单次扩容的节点数;冷却时间等。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值