方式一:把IDEA中写好的程序打jar包然后托入集群中执行如下命令运行:
Hadoop jar wc.jar 全类名 /输入路径 /输出路径
hadoop jar wc.jar
com.atguigu.wordcount.WordCountDriver /user/atguigu/input /user/atguigu/output
方式二:在Windows上向集群提交任务
(1)需要在WordCountDriver添加一些配置信息
设置hdfs NameNode的地址:
conf.set(“fs.defaultFS”, “hdfs://hadoop102:9820”);
指定mapreduce运行在yarn上
conf.set(“mapreduce.framework.name”,“yarn”);
指定mapreduce可以在远程集群上运行
conf.set(“mapreduce.app-submission.cross-platform”,“true”);
指定yarn的resourcemanager的位置
conf.set(“yarn.resourcemanager.hostname”,“hadoop103”);
(2)还要如下的设置
1)检查第一个参数Main class是不是我们要运行的类的全类名,如果不是的话一定要修改!
2)在VM options后面加上 :-DHADOOP_USER_NAME=atguigu
3)在Program arguments后面加上两个参数分别代表输入输出路径,两个参数之间用空格隔开。如:hdfs://hadoop102:9820/input hdfs://hadoop102:9820/output