关键名字:
map:拆分,reduce:集成,job :作业,task: 任务,jobTracker, taskTracker
JobTracker角色:(1)Job作业调度;(2)分配任务,监控任务执行进度,每隔几秒TaskTracker会给JobTracker任务状态更新;
TaskTracker角色:(1)执行任务;(2)向JobTracker汇报任务的执行状态
MapReduce容错机制:允许在在程序执行过程中出现DataNode的某一个节点宕机,重启等故障现象。会采取重复执行或者推测执行来消除错误带来的影响。重复执行4次后仍然失败,则放弃执行。
出错的几种情况:MapReduce程序出错,机器宕机,机器重启或者断电,