下面来配置一个hadoop作业的参数,同配置hadoop环境参数相似。
<span style="font-size:14px;"><hdp:job id="mr-job"
input-path="/input/" output-path="/ouput/"
mapper="org.apache.hadoop.examples.WordCount.TokenizerMapper"
reducer="org.apache.hadoop.examples.WordCount.IntSumReducer"/></span>
配置作业名称为mr-job,输入路径为/input/,输出路径为/output/,
mapper类为org.apache.hadoop.examples.WordCount.TokenizerMapper
reducer类为org.apache.hadoop.examples.WordCount.IntSumReducer
运行这个作业,还需要配置一个运作者
<hdp:job-runner id="myjob-runner" pre-action="cleanup-script" post-action="export-results" job-ref="myjob" run-at-startup="true"/>
需要同时运作多个作业,可以在job-ref属性中全部列出以逗号隔开。
----------------------------------------------------------------------------------------------------------------------------------
马上尝试绑入spring跑个wordcount试试。