1.从waitForCompletion方法说起:
![5250fe721a39b171cdd9c6e2392f79df.png](https://img-blog.csdnimg.cn/img_convert/5250fe721a39b171cdd9c6e2392f79df.png)
2.进入submit()方法:
connect()先和集群建立连接
提交作业前客户端要做的五件事:
1.检查作业的输入输出
2.计算本次任务的切片信息(最重要的部分)
3.在分布式缓存中记录作业信息
4.在分布式文件系统中拷贝作业的jar包,配置信息,切片信息到分布式文件系统中
5.提交作业到JobTracker中,并且监控作业状态(一秒钟检查一次)
![6685ba7d6b8e2973cefdbacc1c1ae14b.png](https://img-blog.csdnimg.cn/img_convert/6685ba7d6b8e2973cefdbacc1c1ae14b.png)
3.Client以及Map端的输入格式配置(TextInputFormat):
1.进入submitJobInternal方法中