Linux(ubantu)下安装hadoop,安装过程超详细解析

一:下载hadoop

二:将hadoop压缩包从windows路径下转移到Linux下

三:配置hadoop的环境变量

        1:将Linux下的hadoop压缩包放在你想要放的目录下,然后进行解压

        2:安装java并配置java环境变量

        3:使用两种方式配置环境变量(将hadoop写入到环境变量PATH中;

                                                             将hadoop的软链接放入到PATH的路径下)

一:下载hadoop

我们知道Linux下安装软件,软件的包有两种:(源码包,二进制包)

        一种是使用软件的源文件(源码包)进行编译,然后安装它的安装步骤进行安装,编译就是将源文件编译为二进制码,使得机器能够识别,这样会特别浪费时间,但是源码包也有自己的优势,就是开源,你打开它,如果发现源码包哪里有bug,你可以自己修改,但是这一般都是业界大佬写的,不会出错,当然你在能看懂的情况下,也可以对软件内部的功能进行修改,卸载比较方便,直接删掉文件即可。

        另一种是二进制包,二进制包就是软件开发者已经将源码包编译好之后的二进制包,我们是看不见源码的,所谓的安装,就是把二进制包放在Linux某个目录下就可以了。安装简单。

        作为新手,我们使用二进制包比较方便,如果自己要编译源码包进行安装比较困难。

下载官网地址:Apache Hadoop

选择二进制包如下图:

 二:将hadoop压缩包从windows路径下转移到Linux下

        直接将下载的hadoop文件压缩包用鼠标拖到Linux某个目录下,我这里拖过去的目录是在个人账号的家目录下(/home/zsw123)   如下图:

三:配置hadoop的环境变量

1:将Linux下的hadoop压缩包放在你想要放的目录下,然后进行解压

        我是将hadoop二进制包放在了家目录下,然后我们解压到软件安装的目录下。此处就和我们在windows下安装软件在某个目录下是一样的,像我一般就是在D盘创建software目录,在software目录下创建对应软件(hadoop)目录,安装微信就在software下创建WeChat目录进行安装。在Linux我习惯在家目录下创建software,然后将hadoop文件解压到software下。操作指令如下:

cd /home/zsw123:到我的家目录下

tar -zxvf hadoop-2.10.1.tar.gz -C /home/zsw123/software:将二进制包解压到software目录下

解压后如下图所示:

  2:安装java并配置java环境变量

        因为hadoop要运行,必须有java环境,如果你提前把hadoop的环境变量配置好,你输入hadoop,命令行会显示没有或者没找到JAVA_HOME,因为你没有安装java环境,并且没有配置JAVA_HOME环境变量。   

        我们可以使用一下方式快速安装java:

        sudo apt install java-11-openjdk-amd64

        这种安装方式,系统会自动将java的运行文件的软链接放在PATH环境变量的某个目录下。安装java成功后输入java,会出现下图:

         那么我们就来详细看一下系统将java的运行文件的软链接放在PATH环境变量的某个目录下是怎么回事?

        当我们在命令行输入一个指令时,系统会在环境变量PATH包含的路径下去寻找,有没有哪个可执行文件或者链接是我们输入的执行指令,如果有就执行,如果没有就说找不到。系统的环境变量PATH如下所示:

         也就是当我们输入某个指令,比如我们安装的java,系统就会在这些目录下面去寻找有没有java的可执行文件或者软链接

        输入whereis java,我们可以看到第一个红框java在这个路径下/usr/bin/java,而/usr/bin正是在如图红框所示$PATH环境变量的目录之一,这就可以解释为什么我们输入java,就可以显示他的详细信息

        /usr/bin/java类型是一个链接,并且在下图第二个红框显示它是软链接指向了/etc/alternatives/java,查看它,也是一个软链接,它指向了/usr/lib/jvm/java-11-openjdk-amd64/bin/java,这个就是Java的可执行文件,我们下载的java包说就是在/usr/lib/jvm/java-11-openjdk-amd64,java的可执行文件在/usr/lib/jvm/java-11-openjdk-amd64/bin下面,一般软件的可执行文件也是在软件包的bin目录下,我们在命令行输入java,系统会去$PATH的路经下去找java,最终会在/usr/bin下面找到java,然后由于/usr/bin/java指向的是/etc/alternatives/java,而/etc/alternatives/java指向的是/usr/lib/jvm/java-11-openjdk-amd64/bin/java,所以最终就会显示java的详细信息。

 java安装包下的文件如下图所示:

 安装包bin下文件如下图所示:

       前面说到系统还要知道JAVA_HOME环境变量的值,其实也就是java安装包的目录,在这里安装包目录是:/usr/lib/jvm/java-11-openjdk-amd64,所以我们配置JAVA_HOME环境变量,写入到/etc/profile文件中,在这里要说的是,并不是一定要写入到/etc/profile文件中,系统的环境变量在启动的时候,文件的调用顺序如下图,所以只要将JAVA_HOME写入到下面的流程图文件中即可,只不过第一个调用的是/etc/profile,这都无所谓,系统启动这一块详细的可以查阅相关资料。

        配置环境变量JAVA_HOME,由于/etc/profile执行权限为只读,所以进入root模式;然后打开文件vi /etc/profile,给文件最后写入:

 然后:wq!强制保存退出。再激活文件,否则需要重启才能激活。激活指令:source /etc/profile。

3:使用两种方式配置环境变量(将hadoop写入到环境变量PATH中;

                                                    将hadoop的软链接放入到PATH的路径下)

        到这里,前期准备工作就做好了。此时就只需要配置Hadoop的环境变量,配置环境变量的本质就是将hadoop的可执行文件放到环境变量$PATH的所有目录其中一个下面(理解这句话非常重要,hadoop可执行文件在安装包的bin目录下,也就是/home/zsw123/software/hadoop-2.10.1/bin。那么就有两种方式。

        第一种就是将hadoop可执行文件路径写入到环境变量PATH中,当在命令行输入hadoop时,此时hadoop可执行文件的目录也是PATH的目录之一,那么它肯定能找到hadoop可执行文件,然后进行执行,这里和上面配置JAVA_HOME环境变量一样,先 vi /etc/profile,然后写入一下内容:

        然后进行激活文件,查看环境变量PATH的值: 

         可以看到hadoop的目录已经添加到了PATH中。

        第二种就和上面系统自动安装java一样,将Java的可执行文件创建一个软链接放在环境变量PATH已经存在的某个目录下面就可以了,当输入hadoop时,系统就会找到hadoop的软链接,然后跳转到hadoop真正的可执行文件那里。

        我们从上面已经知道了/usr/bin是PATH目录之一,所以我们就放在这个下面,操作如下:

 Hadoop可执行文件是/home/zsw123/software/hadoop-2.10.1/bin/hadoop,先创建软链接到/usr/bin/hadoop,然后查看/usr/bin/hadoop,显示可以看书Hadoop指向了原来的路径。

输入hadoop显示如下就算成功了:

到此安装结束了,文中有什么不解的,非常欢迎大家留言交流。可以结合这篇文章和网上其他资料,应该可以对Linux环境变量配置和安装软件包有一个深入的了解。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值