【图文解析 】MapReduce 全局计数器

本文介绍了MapReduce中的全局计数器,它用于记录Job执行进度和状态,有助于性能调优。默认计数器包括输入/输出字节数、条数等。在实际需求中,如统计不合规数据行,可以通过全局计数器实现。文中提供了一个实例,演示如何使用计数器统计单词总数和行数。
摘要由CSDN通过智能技术生成

MapReduce 全局计数器 


1、介绍 
计数器是用来记录 job 的执行进度和状态的。它的作用可以理解为日志。我们可以在程序的 某个位置插入计数器,记录数据或者进度的变化情况。 
 
MapReduce 计数器(Counter)为我们提供一个窗口,用于观察 MapReduce Job 运行期的 各种细节数据。对 MapReduce 性能调优很有帮助,MapReduce 性能优化的评估大部分都是 基于这些 Counter 的数值表现出来的。 
 
MapReduce 自带了许多默认 Counter,现在我们来分析这些默认 Counter 的含义,方便大 家观察 Job 结果,如输入的字节数、输出的字节数、Map 端输入/输出的字节数和条数、 Reduce 端的输入/输出的字节数和条数等 
2、需求 
在实际生产代码中,常常需要将数据处理过程中遇到的不合规数据行进行全局计数,类似这 种需求可以借助 MapReduce 框架中提供的全局计数器来实现 
3、实例 
以下是一个利用全局计数器来统计一个目录下所有文件出现的单词总数和总行数 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值