关于Hadoop的GenericOptionsParser…

最新推荐文章于 2024-03-14 15:06:21 发布

leexurui

最新推荐文章于 2024-03-14 15:06:21 发布

阅读量5.7k

点赞数 1

分类专栏：并行计算与分布式计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leexurui/article/details/52352079

版权

并行计算与分布式计算专栏收录该内容

16 篇文章 0 订阅

订阅专栏

由于集群为hadoop配置了执行队列，所以如果我们程序写成下面这样的话：

Configuration conf = new Configuration();

String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();

...........

FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

我们在运行mapreduce的时候命令上要加 -D mapreduce.job.queuename参数

hadoop jar WordCount.jar WordCount.WordCount -Dmapreduce.job.queuename=root.default xrli/input xrli/output

如果实在想把这些参数都写到代码里面的话，就照着下面写：

Configuration conf = new Configuration(); //从配置文件读取参数

String[] ioArgs=new String[]{"-Dmapreduce.job.queuename =root.default","xrli/STJoin_in","xrli/STJoin_out"};

String[] otherArgs = new GenericOptionsParser(conf, ioArgs).getRemainingArgs();

....................

// 设置输入和输出目录

FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

这样运行的时候只要执行以下命令就行了。

hadoop jar WordCount.jar WordCount.WordCount

这里分析以下Hadoop的GenericOptionsParser类

它能够解析命令行参数的基本类。它能够辨别一些标准的命令行参数。

比如这里的-D mapreduce.job.queuename 就被它识别了，并且配置到了参数文件中去，而函数 getRemainingArgs()就是获取了剩余的两个参数 "xrli/STJoin_in","xrli/STJoin_out"，并且将它们组合为数组 otherArgs。

它能够识别的参数包括： fs jt libjars files archives D tokenCacheFile

http://www.cnblogs.com/caoyuanzhanlang/archive/2013/02/21/2920934.htmlhttp://www.cnblogs.com/caoyuanzhanlang/archive/2013/02/21/2920934.html

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
关于Hadoop的GenericOptionsParser…

由于集群为hadoop配置了执行队列，所以如果我们程序写成下面这样的话： Configuration conf = newConfiguration(); String[] otherArgs = newGenericOptionsParser(conf, args).getRemainingArgs(); ........... File
复制链接

扫一扫

专栏目录

leexurui CSDN认证博客专家 CSDN认证企业博客

码龄13年

76: 原创

25万+: 周排名

149万+: 总排名

14万+: 访问

: 等级

1598: 积分

26: 粉丝

27: 获赞

7: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

argc和argv的定义和用法
魈魈哦-: 终于看懂了！
Python的Nltk包安装使用
qq_39729494: 是不是Temp啊？
Python的Nltk包安装使用
qq_39729494: 大佬，我找不到/local/share，local中share的地方
scikitlearn/theano多分类问题详解
OCC1994: 您好我也是按照DBN那个例子做的训练也是想要得到最后具体的预测值按照您那个预测函数我跑了一下出现这样的错误：Input variables of a Theano function should be contained in a list, even when there is a single input. 我查了一下源码，貌似是指DBN_model.logLayer.y_pred不是一个数组或者元组，请问您出现过这样的问题吗？谢谢！
评分卡模型剖析之一（woe、I…
w7bmz:

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。