阿里大数据云原生化实践，EMR Spark on ACK 产品介绍

最新推荐文章于 2024-01-05 12:12:19 发布

阿里云技术

最新推荐文章于 2024-01-05 12:12:19 发布

阅读量177

点赞数

文章标签：大数据 spark

本文链接：https://blog.csdn.net/weixin_43970890/article/details/117669361

版权

大数据技术发展趋势

云原生化面临挑战

计算与存储分离

如何构建以对象存储为底座的 HCFS 文件系统

shuffle 存算分离

如何解决 ACK 混合异构机型

缓存方案

如何有效支持跨机房、跨专线混合云

ACK 调度

如何解决调度性能瓶颈

其他

阿里实践 - EMR on ACK

整体方案介绍

方案介绍

RSS Q&A

1、为什么需要 Remote Shuffle Service？

RSS 使得 Spark 作业不需要 Executor Pod 挂载云盘。挂载云盘非常不利于扩展性和大规模的生产实践。
云盘的大小无法事前确定，大了浪费空间，小了 Shuffle 会失败。RSS 专门为存储计算分离场景设计。
Executor 将 shuffle 数据写入了 RSS 系统，RSS 系统来负责管理 shuffle 数据，Executor 空闲后即可以回收。[SPARK-25299]
可以完美支持动态资源，避免数据倾斜的长尾任务拖住 Executor 资源不能释放。

2、RSS 性能如何，成本如何，扩展性如何？

Spark Shuffle

EMR Remote Shuffle Service

RSS TeraSort Benchmark

备注说明：以10T Terasort 为例，shuffle 量压缩后大约 5.6T。可以看出该量级的作业在 RSS 场景下，由于 shuffle read 变为顺序读，性能会有大幅提升。

Spark on ECI 效果

Summary

原文链接

本文为阿里云原创内容，未经允许不得转载

阿里云技术

关注