排序器
分组器
分区器,打成K,V,P的形式
buffer缓冲区是环形的,buffer环形缓冲区
环形缓冲区完了的时候,需要手动写一个比较器comporator
之后是combiner聚合
//这里是配置层
Configuration conf=new Configuration(true);
Job job=Job.getInstance();
job.setJarByClass(MyMapReduce.class);
job.setJobName("ooxx");
//设置输入的格式
Path path = new Path("/user/path");
FileInputFormat.addInputPath(job, path);//设置输入的路径
FileInputFormat.setInputDirRecursive(job, true);//使用递归循环
job.setInputFormatClass(sdf.class);//设置输入的格式,默认情况下为text模式
//需要继承inputformat类
//The method setInputFormatClass(Class<? extends InputFormat>)
//in the type Job is not applicable for the arguments (Class<sdf>)
//设置map端的输入
job.setMapperClass(MyMapper.class);
//设置map类方法,需要继承mapper类,并且需要重写里边的map方法
//The method setMapperClass(Class<? extends Mapper>)
//in the type Job is not applicable for