全局计数器
计数器是用于记录job运行状态和进度的 类似于job运行的一个报告。 统计job运行过程中的各个参数,包括job的输入数据量 输出数据量,map输入的数据条数,reduce分组数等等。
其作用范围是全局的,假设运行3个maptask任务, 计数器统计的是3个maptask任务的总和的
内置计数器
Hadoop其实内置了很多计数器。我们先看下运行一个mr程序出来的报告。
例如:
2018-07-23 20:55:43,336 INFO [LocalJobRunner Map Task Executor #0] mapred.Task (Task.java:done(1080)) - Final Counters for attempt_local445845887_0001_m_000000_0: Counters: 17//计数器总数
File System Counters
FILE: Number of bytes read=468
FILE: Number of bytes written=293975
FILE: Number of read operations=0
FILE: Number of large read operations=0
FILE: Number of write operations=0
Map-Reduce Framework
Map input records=16
Map output records=16
Map output bytes=352
Map output materialized bytes=390
Input split bytes=101
Combine input records=0
Spilled Records=16
Failed Shuffles=0
Merged Map outputs=