Spark on Kubernetes 与 Spark on Yarn 不完全对比分析

前言

Apache Spark 是目前应用最广泛的大数据分析计算工具之一。它擅长于批处理和实时流处理,并支持机器学习、人工智能、自然语言处理和数据分析应用。随着 Spark 越来越受欢迎,使用量越来越大,狭义上的 Hadoop (MR) 技术栈正在收缩。另外,普遍的观点和实践经验证明,除了大数据相关的工作负载,Hadoop (YARN) 不具备相应的灵活性去跟更广泛的企业技术栈融合与集成。比如去承载一些在线业务,而这正是 Kubernetes(K8s) 所擅长的领域。事实上,Kubernetes 的出现为 Spark 的改进打开了一个新世界的大门,创造了更多机遇。如果能用统一的一套集群去运行所有在线和离线的作业,也是十分吸引人的事情。

Spark on Kubernetes 于 Spark 2.3 [1] 版本引入开始,到 Spark 3.1 [2] 社区标记 GA,基本上已经具备了在生产环境大规模使用的条件。

在业内,苹果[3], 微软[4], 谷歌,网易,华为、滴滴,京东等公司都已经有内部大规模落地或者对外服务的经典成功案例。

Spark on Kubernetes 应用架构

从 Spark 整体计算框架层面来看,只是在资源管理层面多支持了一种调度器,其他接口都可以完全复用。一方面 Kubernetes 的引入和 Spark Standalone、YARN、 Mesos 及 Local 等组件形成了一个更为丰富的资源管理体系。

另一方面,Spark 社区在支持 Kubernetes 特性的同时,对用户 API 的兼容度也得到了最大化的保留,极大程度上方便了用户任务的迁移。比如对于一个传统的 Spark 作业而言,我们通过简单的指定 --master 参数为 yarn 或者 k8s://xxx,即可完成两个调度平台的运行时切换。其他参数诸如镜像、队列、Shuffle 本地盘等配置, yarn 和 k8s 之间都是隔离的,可以很方便地统一在配置文件中统一维护。

Spark on Kubernetes vs Spark on YARN

易用性分析

Spark Native API

Spark on YARNSpark on Kubernetes是两种同的运行Apache Spark应用程序的方式,它们各自有同的优势和适用场景。 Spark on YARN是将Spark集成到Apache Hadoop YARN(Yet Another Resource Negotiator)集群上。YARN是Hadoop 2.0中引入的资源管理组件,它可以作为通用的资源管理层,负责集群中的资源分配和任务调度。在YARN上运行Spark,可以利用YARN已经成熟的集群管理能力,如资源分配、任务调度、监控等。这种方式对于那些已经部署了Hadoop环境的用户来说是一个很好的选择,因为它允许用户在一个统一的生态系统中使用Spark进行数据处理和分析,同时利用Hadoop的存储能力。 Spark on Kubernetes(简称Spark on K8s)则是将Spark应用程序部署在Kubernetes容器编排平台上。Kubernetes是一个开源系统,用于自动化部署、扩展和管理容器化应用程序。在K8s上运行Spark可以实现更加灵活和自动化的部署,容器化带来的隔离性和轻量级特性使得资源利用率更高,也更易于管理和扩展。此外,Spark on K8s支持原生的Kubernetes服务发现、持久化存储和自动化滚动更新等特性。 选择Spark on YARN还是Spark on Kubernetes取决于多个因素,包括现有的技术栈、资源管理的需求、部署和运维的便利性等。例如: 1. 如果组织已经投资了Hadoop生态系统,并希望利用现有的YARN资源来运行Spark作业,那么Spark on YARN可能是更好的选择。 2. 如果组织希望利用容器化带来的灵活性和自动化优势,或者有多种同的应用程序需要在一个统一的容器平台上管理,Spark on Kubernetes可能更适合。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

网易杭研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值