MapReduce编写实现wordcount词频统计

 

首先编写WordCountDriver:

package com.jym.hadoop.mr.demo;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.CombineTextInputFormat;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/**
 * 这个程序相当于一个yarn集群的客户端,
 * 需要在此封装我们的mr程序的相关运行参数,指定jar包,
 * 最后提交给yarn
 * */
public class WordcountDriver 
{
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException
    {
        Configuration conf=new Configuration();
        
        /*其实如果在本地运行MR程序其实不用配置下面的代码程序,在MR默认下就是本地运行*/
        /**下面这段代码配置的是在本地模式下运行MR程序*/
        /**是否运行为本地模式,就是看这个参数值是否为local,默认就是local;*/
        //conf.set("mapreduce.framework.name", "local");        //在本地运行MR程序
        //本地模式运行MR程序时,输入输出的数据可以在本地,也可以在hdfs上
        //到底在哪里,就看以下两行配置用哪一行了,默认是“file:///”
        /**conf.set("fs.defaultFS", "hdfs://hadoop1:9000");*/       //使用的是HDFS系统
        //conf.set("fs.defaultFS", "file:///");                                  //使用的是本地Windows磁盘
        
        
        /**运行集群模式,就是把程序提交到yarn中去运行
         * 要想运行为集群模式,以下3个参数要指定为集群上的值
         * */<

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值