Hadoop学习之路(三)Hadoop-3.1.1在CentOS-7.6上的编译

一、配置编译环境

1、安装基础库

配置yum源,通过yum安装如下基础库和依赖,yum源配置可查看CentOS7 yum源配置
(1)安装GCC

yum -y install gcc.aarch64 gcc-c++.aarch64 gcc-gfortran.aarch64 libgcc.aarch64

(2)安装依赖

yum install -y wget openssl-devel zlib-devel automake libtool make  libstdc++-static glibc-static git snappy snappy-devel fuse fuse-devel
2、安装OpenJDK

安装OpenJDK

3、安装Maven

Maven3.5.4 安装

4、安装CMake

Hadoop编译要求3.12及以上版本,本文以安装CMake 3.12.4版本为例
1、下载CMake安装包

wget https://cmake.org/files/v3.12/cmake-3.12.4.tar.gz

2、解压安装包

tar -zxf cmake-3.12.4.tar.gz

3、编译安装CMake

cd cmake-3.12.4
./bootstrap
make -j8
make install
5、安装Protobuf
yum install -y protobuf protobuf-devel
protoc --version

在这里插入图片描述

二、编译Hadoop

1、下载Hadoop源码包

wget https://archive.apache.org/dist/hadoop/common/hadoop-3.1.1/hadoop-3.1.1-src.tar.gz

2、解压源码包

tar -zxvf hadoop-3.1.1-src.tar.gz

cd hadoop-3.1.1-src

3、修改pom.xml文件

vim pom.xml

国内可以添加国内的maven源
在repositories标签的第一位添加maven仓库源:

    <repository>
        <id>alimaven</id>
        <name>aliyun maven</name>
        <url>http://maven.aliyun.com/nexus/content/repositories/central/</url>
    </repository>
     <repository>
        <id>huaweicloud</id>
        <name>huawei maven</name>
        <url>http://mirrors.huaweicloud.com/repository/maven</url>
    </repository>

除了依赖仓库源,还要添加插件仓库源,pluginRepositories和repositories的节点级别一样:

<pluginRepositories>
  <pluginRepository>
    <id>huaweicloud-plugin</id>           
    <url>http://mirrors.huaweicloud.com/repository/maven</url>
    <snapshots>
      <enabled>true</enabled>
    </snapshots>
  </pluginRepository>
</pluginRepositories>

4、执行基础编译命令

mvn package -DskipTests -Pdist,native -Dtar -Dmaven.javadoc.skip=true

如果需要添加snappy库等其他依赖可以参考如下:
snappy库需要另外安装。

mvn package -DskipTests -Pdist,native -Dtar -Dsnappy.lib=/usr/local/lib64 -Dbundle.snappy -Dmaven.javadoc.skip=true

编译成功后,将在源码下的“hadoop-dist/target/”目录生成tar.gz包。

在这里插入图片描述

Hadoop Eclipse Plugin是一个用于在Eclipse集成开发环境中进行Hadoop应用程序开发的插件。版本3.1.1是该插件的一个特定版本。 Hadoop是一个用于处理大数据集的分布式计算框架。它能够在集群中对大规模数据进行并行处理和存储。Eclipse是一个广为人知的开发环境,它提供了丰富的工具和插件来帮助开发者进行代码编写和调试。 Hadoop Eclipse Plugin的作用是将Hadoop和Eclipse集成在一起,使得开发者能够在Eclipse中方便地开发、调试和部署Hadoop应用程序。该插件提供了一系列的工具和功能,包括Hadoop项目的创建、调试器的集成、HDFS文件浏览以及任务监控等。 通过使用Hadoop Eclipse Plugin,开发者可以在Eclipse中创建Hadoop项目,并且可以方便地进行代码编写、构建和调试。插件提供了完整的Hadoop API的支持,开发者可以利用这些API来操作HDFS文件系统、编写MapReduce作业等。 此外,Hadoop Eclipse Plugin还提供了集成的调试器,开发者可以利用它来对Hadoop应用程序进行逐步调试,帮助定位问题和提高代码质量。 插件还提供了HDFS文件浏览器,它允许开发者浏览和管理Hadoop分布式文件系统中的文件和目录。 最后,Hadoop Eclipse Plugin还提供了任务监控功能,可以显示正在运行的MapReduce任务的状态和进度。 总而言之,Hadoop Eclipse Plugin的版本3.1.1为开发者提供了在Eclipse中开发Hadoop应用程序所需的一些重要功能和工具,它简化了Hadoop开发的流程,提高了开发效率和代码质量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值