Spark 应用优化工具之Sparklens

Sparklens是什么?

Sparklens是一个内置 Spark 调度器模拟器的 Spark 分析工具:它可以更容易地理解 Spark 应用程序的可扩展性限制。它有助于了解给定的 Spark 应用程序使用提供给它的计算资源的效率如何。它已在Qubole实施并维护。它是开源的(Apache 许可证 2.0)并已在 Scala 中实现。

Sparklens 的一个有趣特性是它能够通过单次运行 Spark 应用程序生成估计值. 它报告信息,例如估计完成时间和估计的集群利用率与不同数量的执行程序,一个作业/阶段时间线,显示如何在作业中安排并行阶段,以及许多有趣的每个阶段指标。

Sparklens使用方法

有四种使用 Sparklens 的方法:

  • 实时模式
  • 离线模式
  • 在事件历史文件上运行
  • 笔记本

下面说下实时和离线模式

实时模式

Sparklens 可以使用以下选项在应用程序执行时运行(对于 spark-submit 和 spark-shell):

--packages qubole:sparklens:0.2.1-s_2.11
--conf spark.extraListeners=com.qubole.sparklens.QuboleJobListener

或通过编程方式将Sparklens依赖项添加到Java / Scala项目中(这是Maven的示例):

<repositories>
   <!-
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值