Hadoop--MapReduce自动化运行配置(Maven Helper)

最新推荐文章于 2022-04-19 10:28:51 发布

hakusai22

最新推荐文章于 2022-04-19 10:28:51 发布

阅读量231

点赞数

分类专栏： # Hadoop 文章标签： hadoop

https://github.com/hakusai22

本文链接：https://blog.csdn.net/weixin_45480785/article/details/111240995

版权

Hadoop 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

这里写目录标题

一. Hadoop--MapReduce自动化运行配置

一. Hadoop–MapReduce自动化运行配置

1. idea下载Maven插件

插件名: Maven Helper
在这里插入图片描述

2. 指定main class 信息

2. 传统hadoop集群并执行hadoop_hdfs.jar包

[root@hadoop15 ~]# hadoop jar hadoop_hdfs.jar com.xizi.phonedata.PhoneCleanDataJob

默认直接通过maven插件打成jar包中没有指定main class 信息,因此在运行mapreduce的jar包时必须在指令后面明确指定main class 的信息是谁。
在执行mapreduce作业时会加大执行的难度,因此我们需要在打jar包时指定main class信息,减少执行作业时的操作,
如果需要在打包中指定main class 信息:只需要对打包插件进行配置即可:

3. 就可以直接执行jar包,不需要额外指定main class 信息

    <plugins>
        <!-- 在打包插件中指定main class 信息 -->
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-jar-plugin</artifactId>
            <configuration>
            		//	jar包位置
                <outputDirectory>${basedir}/target</outputDirectory>
                <archive>
                    <manifest>
                    	//运行的类全类名
                        <mainClass>com.xizi.phonedata.PhoneCleanDataJob</mainClass>
                    </manifest>
                </archive>
            </configuration>
        </plugin>

jar包输出位置

在这里插入图片描述

3. 使用wagon插件实现自动上传至hadoop集群

  <build>
  <!--扩展maven的插件中加入ssh插件-->
	<extensions>
		<extension>
			<groupId>org.apache.maven.wagon</groupId>
			<artifactId>wagon-ssh</artifactId>
			<version>2.8</version>
		</extension>
	</extensions>
	<plugins>
		<plugin>
			<groupId>org.codehaus.mojo</groupId>
			<artifactId>wagon-maven-plugin</artifactId>
			<version>1.0</version>
			<configuration>
				<fromFile>target/test.jar 或者 ${project.build.finalName}.jar</fromFile>
				<url>scp://root:123456@127.0.0.1/root</url>
			</configuration>
		</plugin>
	</plugins>
</build>

1. 打包后直接执行wagon uplod-single即可
在这里插入图片描述
2. 执行命令操作: clean package wagon:upload-single

4. 使用wagon上传jar完成后远程执行job作业

<plugin>
  <groupId>org.codehaus.mojo</groupId>
  <artifactId>wagon-maven-plugin</artifactId>
  <version>1.0</version>
  <configuration>
    <fromFile>target/${project.build.finalName}.jar</fromFile>
    <url>scp://root:123456@127.0.0.1/root</url>
    <commands>
      <!-- 通过sh 执行shell脚本文件 -->
      <command>nohup hadoop-2.9.2/bin/hadoop jar hadoop_wordcount-1.0-SNAPSHOT.jar > /root/mapreduce.out 2>&amp;1 &amp; </command>
    </commands>
    <displayCommandOutputs>true</displayCommandOutputs>
  </configuration>
</plugin>

1. 执行命令操作:clean package wagon:upload-single wagon:sshexec
在这里插入图片描述

2. 执行优化一行代码直接优化

在这里插入图片描述
3. 执行成功

在这里插入图片描述

hakusai22

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop--MapReduce自动化运行配置(Maven Helper)

这里写目录标题一. Hadoop--MapReduce自动化运行配置1. idea下载Maven插件2. 指定main class 信息3. 使用wagon插件实现自动上传至hadoop集群4. 使用wagon上传jar完成后远程执行job作业一. Hadoop–MapReduce自动化运行配置1. idea下载Maven插件插件名: Maven Helper2. 指定main class 信息2. 传统hadoop集群并执行hadoop_hdfs.jar包[root@hadoop15 ~]
复制链接

扫一扫