前言
Hadoop 部署
1. 环境 centos7 + Java8 + hadoop3.2.2
wget https://dlcdn.apache.org/hadoop/common/hadoop-3.2.2/hadoop-3.2.2.tar.gz
运行需要Java 环境依赖,我之前已经配置过了。这里简单说下。
#这里 配置java的环境 还要配置 Hadoop的环境
vi /etc/profile
#java environment
export JAVA_HOME=/usr/local/java/jdk1.8.0_291
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin
#hadoop
export HADOOP_HOME=/usr/local/work/hadoop/hadoop-3.2.2
export PATH=$PATH:$HADOOP_HOME/bin:/$HADOOP_HOME/sbin
配置生效
source /etc/profile
2.解压jar,创建hadoop 存放数据的目录
tar -zxf hadoop-3.2.2.tar.gz
我在解压后的文件下创建 flhaddop ,然后创建对应的 Hadoop 不同数据存放为文件。
# 在flhadoop 文件下依次创建 hdfs(在这个文件下 在创建 data 和 name ) log(存放日志) tmp(临时文件)
mkdir hdfs
3.修改hadoop-env.sh
cd hadoop-3.2.2/etc/hadoop/
vi hadoop-env.sh
加上一句 命令
export JAVA_HOME=/usr/local/java/jdk1.8.0_291/
4.core-site.xml,这个文件是配置hdfs访问路劲,和namenode临时文件夹路劲
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://10.26.118.120:9001</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/work/hadoop/hadoop-3.2.2/flhadoop/tmp</value>
</property>
</configuration>
5.hdfs-site.xml。这文件是配置元数据和datanode数据的存放路径
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/work/hadoop/hadoop-3.2.2/flhadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/work/hadoop/hadoop-3.2.2/flhadoop/hdfs/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
6.初始化
cd /usr/local/work/hadoop/hadoop-3.2.2/bin/
## 执行
hdfs namenode -format
出现下图说明成功了,此时jps查看是没有namenode,需要去启动
7. 启动Hadoop
分别启动namenode,datanode,secondarynamenode。
在 sbin 目录下执行
./hadoop-daemon.sh start namenode
./hadoop-daemon.sh start datanode
./hadoop-daemon.sh start secondarynamenode
hadoop 常用启动和停止命令总结:
https://blog.csdn.net/weixin_43975771/article/details/119993527
验证:
输入 ./hadoop fs -ls / 没报错 说明部署成功。
特别注意:HaDoop3.0之前web访问端口是50070 hadoop3.0之后web访问端口为9870
ip:9870/dfshealth.html#tab-overview 看下