一文快速学会Hadoop伪分布式环境搭建,很详细


一、准备工作

配置hadoop模板虚拟机(学习篇)

CentOS7安装jdk

centos7 安装hadoop

二、配置ssh免密登录

首先使用以下命令在家目录下是否有.ssh目录

ls -lah

在这里插入图片描述
如果没有,可以使用

ssh localhost

然后进入这个文件

cd .ssh

生成密钥

ssh-keygen -t rsa

输入上面的代码后回车四次
在这里插入图片描述
把公钥拷贝到本台虚拟机上面去

ssh-copy-id 192.168.90.105

在这里插入图片描述

到此我们的免密登录就算是配置完成了。

验证一下是否需要密码

ssh localhost

在这里插入图片描述

三、修改hadoop的配置文件

注意:这里需要的配置文件都在$HADOOP_HOME/etc/hadoop里,就是安装路径/hadoop3.x/etc/hadoop
下面是我们这里需要修改配置的几个文件
在这里插入图片描述
1.配置hadoop-env.sh⽂件

vim hadoop-env.sh

把java_home的地址给写上去。

按 i 插入

在这里插入图片描述
2.配置core-site.xml

vim core-site.xml

按 i 插入

<configuration>
 <property>
 <name>fs.defaultFS</name>
 <value>hdfs://hadoop105:8020</value>
 </property>
 <property>
 <name>hadoop.tmp.dir</name>
 <value>/opt/module/hadoop-3.3.5/data</value>
 </property>
</configuration>

:wq

保存文件

3.配置hdfs-site.xml⽂件

vim hdfs-site.xml

按 i 插入

<configuration>
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>
 <property>
 <name>dfs.permissions.enabled</name>
 <value>false</value>
 </property>
</configuration>
:wq

保存文件

配置说明:
dfs.replication: ⽤于指定⽂件块的副本数量。HDPS特别适合于存储⼤⽂件,它会将⼤⽂件切分成每128MB⼀块,存储到不同的DataNode节点上,且默认将每⼀块备份2份,共3份,即此配置的默认值为3,最⼤为512MB。由于我们只有⼀个DataNode节点,所以这⾥将⽂件副本数量修改为1。
dfs.permissions.enabled:访问时是否检查安全,默认为tue。为了⽅便访问,暂时修改为false

4.配置mapred-site.xml⽂件

vim mapred-site.xml

按i插入

<configuration>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
</configuration>
:wq

保存

配置说明:
mapreduce.framework.name:⽤于指定调试⽅式。这⾥指定使⽤YARN作为任务调⽤⽅式。
5.配置yarn-site.xml⽂件

hadoop classpath

会出现一大片的东西,准备备用

vim yarn-site.xml

按i插入

下面的claspath插入上面生成的东西

<configuration>
 <property>
 <name>yarn.resourcemanager.hostname</name>
 <value>hadoop105</value>
 </property>
 <property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
<property>
 <name>yarn.application.classpath</name>
 <value>
 /opt/module/hadoop-3.3.5/etc/hadoop:/opt/module/hadoop-3.3.5/share/hadoop/common/lib/*:/opt/module/hadoop-3.3.5/share/hadoop/common/*:/opt/module/hadoop-3.3.5/share/hadoop/hdfs:/opt/module/hadoop-3.3.5/share/hadoop/hdfs/lib/*:/opt/module/hadoop-3.3.5/share/hadoop/hdfs/*:/opt/module/hadoop-3.3.5/share/hadoop/mapreduce/*:/opt/module/hadoop-3.3.5/share/hadoop/yarn:/opt/module/hadoop-3.3.5/share/hadoop/yarn/lib/*:/opt/module/hadoop-3.3.5/share/hadoop/yarn/*
 </value>
 </property>
</configuration>

:wq

保存
配置说明:
yarn.resourcemanager.hostname:⽤于指定ResourceManager的运⾏主机,默认0.0.0.0,即本机。
yarn.nodemanager.aux-services:⽤于指定执⾏计算的⽅式为mapreduce_shuffle。
yarn.application.classpath:⽤于指定运算时的类加载⽬录。

6.配置workers⽂件
workers⽂件之前的版本叫slaves,但功能⼀样。主要⽤于在启动时同时启动DataNode和NodeManager。

workers在$HADOOP_HOME/hadoop-3.x/etc/hadoop/workers

vim workers

改成当前节点的hostname,我的是hadoop105

四、格式化namenode节点,启动hdfs,启动yarn

注意这里不能⽤root账号启动进程,需要在环境变量中配置

vim /etc/profile
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
 source /etc/profile

执行

格式化namenode

hdfs namenode -format

执行

start-dfs.sh
start-yarn.sh

再执行

jps

像这样就算是完成了。
在这里插入图片描述

到此为止,我们配置完了hadoop伪分布式安装

  • 8
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是搭建分布式Hadoop环境的步骤: 1. 安装Java Hadoop需要Java环境,所以需要先安装Java。 ``` sudo apt-get update sudo apt-get install default-jdk ``` 2. 安装Hadoop 下载Hadoop安装包并解压: ``` wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz tar -xzvf hadoop-2.10.1.tar.gz sudo mv hadoop-2.10.1 /usr/local/hadoop ``` 3. 配置Hadoop环境变量 打开hadoop-env.sh件进行编辑: ``` sudo nano /usr/local/hadoop/etc/hadoop/hadoop-env.sh ``` 将以下内容添加到件的末尾: ``` export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64 export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` 保存并退出。 4. 配置Hadoop 打开core-site.xml件进行编辑: ``` sudo nano /usr/local/hadoop/etc/hadoop/core-site.xml ``` 将以下内容添加到件的末尾: ``` <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` 保存并退出。 打开hdfs-site.xml件进行编辑: ``` sudo nano /usr/local/hadoop/etc/hadoop/hdfs-site.xml ``` 将以下内容添加到件的末尾: ``` <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value> </property> </configuration> ``` 保存并退出。 5. 格式化Hadoop件系统 运行以下命令来格式化Hadoop件系统: ``` hdfs namenode -format ``` 6. 启动Hadoop 运行以下命令来启动Hadoop: ``` start-all.sh ``` 7. 检查Hadoop状态 运行以下命令来检查Hadoop状态: ``` jps ``` 如果一切正常,你应该看到以下进程: ``` NameNode SecondaryNameNode DataNode ResourceManager NodeManager ``` 这样,分布式Hadoop环境搭建完成了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值