Dr-Elephant架构原理

Dr.Elephant是LinkedIn开源的Hadoop和Spark性能监控工具,通过自动化数据采集、应用诊断规则进行性能分析,并提供优化建议。其架构包括数据采集模块(Job Generator、MapReduce Fetcher、Spark Fetcher)、诊断规则模块(如Mapper倾斜、Reducer GC等)以及优化建议模块,旨在提升开发效率和集群任务调试效果。
摘要由CSDN通过智能技术生成

一、项目介绍

Dr.Elephant 由 LinkedIn 于 2016 年 4 月份开源,是一个 Hadoop 和 Spark 的性能监控和调优工具。Dr.Elephant 能自动化收集所有计算任务指标,进行数据分析,并以简单易用的方式进行呈现。Dr.Elephant 的目标是提高开发人员的开发效率和增加集群任务调试的高效性。

二、架构

Dr.Elephant的架构如下图:
在这里插入图片描述

三、模块原理

1.数据采集

Job Generator: 任务采集

<property>
  <name>drelephant.analysis.thread.count</name>
  <value>3</value>
  <description>Number of threads to analyze the completed jobs 采集线程数</description>
</property>
<property>
  <name>drelephant.analysis.fetch.interval</name>
  <value>60000</value>
  <description>
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值