java 计算输入数据的商_Hadoop(4-1)-MapReduce程序案例-统计销售商品数量

1.问题陈述:

找出销往各个国家商品数量。

输入: 我们的畋输入数据集合是一个 CSV 文件, Sales2014.csv

输出:国家名 销往次国家的商品数量

商品信息如图所示

11666cd75fbba5a48727717fb1ae88a2.png

2.前提条件:

• 本教程是在Linux上开发

• 已经安装了Hadoop(本教程使用版本2.6.5)

• 系统上已安装了Java(本教程使用 JDK1.8.0)。

3.步骤:(先运行成功再看4的解释)

3.1.创建一个新的目录名称是:MapReduceTutorial

[[email protected] /]# cd /usr/local

[[email protected] local]# mkdir MapReduceTutorial

3.2.授予权限

[[email protected] local]# chmod -R 777 MapReduceTutorial

3.3 下载相关文件:下载 Java 程序文件,拷贝以下文件:SalesMapper.java, SalesCountryReducer.java 和 SalesCountryDriver.java 到 MapReduceTutorial 目录中,

3.4 检查所有这些文件的文件权限是否正确:ll

419c95176475a9872a7134d15ed4f26d.png

如果“读取”权限缺少可重新再授予权限,执行以下命令: chmod +r *

3.5 在MapReduceTutorial文件夹下新建一个文件夹SalesCountry用于存放编译好的class文件

[[email protected] MapReduceTutorial]# mkdir SalesCountry

3.6.导出类路径

[root@hdp-node-01MapReduceTutorial]# export CLASSPATH="$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.6.5.jar:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-common-2.6.5.jar:$HADOOP_HOME/share/hadoop/common/hadoop-common-2.6.5.jar:~/MapReduceTutorial/SalesCountry/*:$HADOOP_HOME/lib/*"

注意:其中Hadoop版本需替换为自己的

执行完此步后java编译后将放在SalesCountry文件夹下

3.7 编译Jav[[email protected] MapReduceTutorial]# javac -d . SalesMapper.java SalesCountryReducer.java SalesCountryDriver.java上面-d后有一点

3.8查看SalesCountry文件夹

[root@hdp-node-01 MapReduceTutorial]# ls ./SalesCountry

SalesCountryDriver.class SalesCountryReducer.class SalesMapper.class

3.9 创建一个新的文件:Manifest.txt——–这样运行jar时不用再指定主类

[[email protected] MapReduceTutorial]# vi Manifest.txt

添加以下内容到文件中:

Main-Cl

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值