Map阶段需要继承Mapper类实现自定义核心逻辑,Reduce阶段需要继承Reducer实现自定义核心逻辑:
1.易于编程
2.高容错
一台机器挂了,可以把上面的任务转义到另外一个节点上运行,不至于这个任务运行失败
3.适合PB级以上数据的离线处理
Map阶段需要继承Mapper类实现自定义核心逻辑,Reduce阶段需要继承Reducer实现自定义核心逻辑:
1.易于编程
2.高容错
一台机器挂了,可以把上面的任务转义到另外一个节点上运行,不至于这个任务运行失败
3.适合PB级以上数据的离线处理