一个大数据学生的HDFS完全分布式集群搭建流程与问题

痋

已于 2022-09-16 14:04:11 修改

阅读量736

点赞数

文章标签： hdfs 大数据 hadoop 分布式

于 2022-09-15 18:54:49 首次发布

本文链接：https://blog.csdn.net/qq_53879605/article/details/126864332

版权

前言

HDFS作为Hadoop的核心组件，其搭建是Hadoop集群能够成功运行的基础，本文就描述了我在搭建HDFS集群时的流程与遇到的问题。

HDFS是一个完全分布式文件系统：引入存放文件元数据信息的服务器Namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。

首先我们应该有一个做好免密登录且互相连接的虚拟机流程详见
链接: https://blog.csdn.net/qq_53879605/article/details/126883887?spm=1001.2014.3001.5501

vi /etc/hostname

hostname
node01的主机名（node02,node03同样要检查，为简便后文以01，02，03称呼）

vi /etc /hosts

hosts
01，02，03host文件相同

ssh node02

java -version

JDK
02，03都应检查

cd /opt
mkdir software
cd software/
mkdir hadoop
cd hadoop/
mkdir hdfs
cd hdfs/
mkdir data
mkdir name
mkdir tmp

cd /opt/software/hadoop
yum-y install lrzsz
rz # 上传hadoop-2.9.2.tar.gz

tar -xvzf hadoop-2.9.2.tar.gz

上传Hadoop时只需将hadoop-2.9.2.tar.gz 拖到xshell下即可
文件下载链接: https://pan.baidu.com/s/1kcu2FvwjKTijW-lMd4h6VQ?pwd=yre0
提取码yre0

vi /etc/profile

#修改的语句为

export HADOOP_HOME=/opt/software/hadoop/hadoop-2.9.2
export PATH=${
   PATH}:${
   HADOOP_HOME}/bin:${
   HADOOP_HOME}/sbin

刷新环境变量

source /etc/profile

测试Hadoop是否安装

hadoop version

Hadoop启动成功

无需修改配置只是修改JAVAHOME和HADOOPCONF_DIR的值


cd /opt/software/hadoop/hadoop-2.9.2/etc

关注