Spark十三 Spark调优和调试

1 SparkConf配置机制

    1) SparkConf实例包含重载配置选项的字符串键值对,set()方法

    2) 配置优先级:代码中set() > spark-submit设置 > 配置文件的值 > 系统的默认值


2 执行部件:Jobs, Tasks, and Stages

1) 任务内部流程

从数据存储或已有RDD或数据混洗获取输入数据

执行转化操作计算新的RDD,执行行动操作计算结果

把输出写入到数据混洗文件中,或写入外部存储,或返回给驱动器程序

2) Spark执行时的流程

    > 用户代码定义RDD的DAG

    > 行动操作把DAG转为物理执行计划

    > 在集群中调度并运行任务


3 查找信息

1) Spark Web UI

2) 驱动器进程和执行器进程的日志


4 关键性能考量Key Performance Considerations

并行度

序列化格式

内存管理

硬件供给


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值