老师好像说这部分 面试不会问 + 以后也不咋会用 (#^.^#) 简单记下吧。
软件和操作系统版本
Hadoop框架是采用Java语言编写,需要java环境(jvm)
JDK版本:JDK8版本
集群:
知识点学习:统一使用vmware虚拟机虚拟三台linux节点,linux操作系统:Centos7
项目阶段:统一使用云服务器,5台云服务器节点
Hadoop搭建方式
单机模式:单节点模式,非集群,生产不会使用这种方式
单机伪分布式模式:单节点,多线程模拟集群的效果,生产不会使用这种方式
完全分布式模式:多台节点,真正的分布式Hadoop集群的搭建(生产环境建议使用这种方式)
一、虚拟机准备环境
1. 三台虚拟机(静态IP,关闭防火墙,修改主机名,配置免密登录,集群时间同步)
2. 在/opt目录下创建文件夹
3. Hadoop下载地址:
https://archive.apache.org/dist/hadoop/common/hadoop-2.9.2/
Hadoop官网地址:
http://hadoop.apache.org/
4. 上传hadoop安装文件到/opt/lagou/software
二、集群规划![](https://img-blog.csdnimg.cn/20210623160149320.png)
三、安装hadoop
一、安装hadoop
登录linux121节点:
a.进入/opt/lagou/software,解压安装文件到/opt/lagou/servers
tar -zxvf hadoop-2.9.2.tar.gz -C /opt/lagou/servers
b.查看是否解压成功 ll /opt/lagou/servers/hadoop-2.9.2
c.添加Hadoop到环境变量 vim /etc/profile
##HADOOP_HOME
export HADOOP_HOME=/opt/lagou/servers/hadoop-2.9.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
d.使环境变量生效 source /etc/profile
e.验证hadoop hadoop version
hadoop目录介绍:
1. bin目录:对Hadoop进行操作的相关命令,如hadoop,hdfs等
2. etc目录:Hadoop的配置文件目录,入hdfs-site.xml,core-site.xml等
3. lib目录:Hadoop本地库(解压缩的依赖)
4. sbin目录:存放的是Hadoop集群启动停止相关脚本,命令
5. share目录:Hadoop的一些jar