ODPS MapReduce基础

ODPS MapReduce基础

执行MapReduce Job(jar)命令
jar -libjars [resoucre_name] -classpath [local_package_path] [MainClass] [arguments1] [arguments2]...;
  • resoucre_name指发布到odps上的资源文件,即MapReduce任务jar包名称,如wordCount.jar
  • local_package_path指MapReduce任务jar包本地路径,如~/demos/deploy/wordCount/wordCount.jar
  • MainClass指MapReduce任务main函数所在的类名,如study.odps.demo.mapreduce.WordCount
  • [arguments1] [arguments2]...即传入main函数参数,无参数可不填
e.g 本地启动MR Job命令
jar -libjars wordCount.jar -classpath ~/demos/deploy/wordCount/wordCount.jar study.odps.demo.mapreduce.WordCount

需要注意:
- 与MR Job相关的资源必须上传至ODPS,如与MR任务相关只有wordCount.jar这个文件,未引用其他自定义jar或者第三方jar,那么将wordCount.jar这个文件添加至ODPS资源中即可。添加资源文件可以使用IDE插件添加,或者使用add命令添加,如:


add jar ~/demos/deploy/wordCount/wordCount.jar -f;

- 如果构建Map task或Reduce task引用了其他自定义jar或者第三方jar,依赖的资源需添加至ODPS,并且需以-resources方式指定依赖的资源可参考ODPS MRODPS MapReduce WordCount作业提交

e.g 线上(Dataworks)启动MR Job
jar -resources argparse4j.jar,mapreduce-examples.jar,common.jar -classpath mapreduce-examples.jar,argparse4j.jar
study.odps.mapreduce.demos.WordCount wc_in wc_out

上述例子引用了三个资源包:argparse4j.jarmapreduce-examples.jar、common.jar,主类位于mapreduce-examples.jar,但主类的入口函数使用了argparse4j.jar解析参数,所以classpath需要引用mapreduce-examples.jar,argparse4j.jar两个jar包,而common.jar在MapReduce Task里使用到,但在主类并未使用,因此classpath无需引入common.jar`。

  • 注意每个资源文件以,符号分割
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值