hadoop伪分布式搭建

最新推荐文章于 2022-11-03 13:11:25 发布

远航ing

最新推荐文章于 2022-11-03 13:11:25 发布

阅读量171

点赞数

分类专栏：大数据集群搭建文章标签： hadoop 伪分布式

本文链接：https://blog.csdn.net/weixin_42632608/article/details/82898640

版权

大数据集群搭建专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一步首先创建一个新的用户？为什么要创建一个新的用户？
因为linux系统可以对不同的用户，赋予不同的权限，通过这种方式可以限制不同用户对linux系统的操作。

创建一个新的用户？因为权限的问题使用root用户
command：useradd username 增加用户
在这里插入图片描述
command:passwd username 修改用户的密码

修改本机的名字
需要修改两个配置文件
1./etc/hostname
将localhost修改成为hadoop
2./etc/hosts
在文件后面追加本机的ip地址和主机名

hosts配置文件内容为

配置无密码登录
cd ~/.ssh
ssh-keygen -t rsa # 通过ssh-keygen命令来生成密钥对在.ssh目录下（会有提示，回车即可）。
cat id_rsa.pub >> authorized_keys # 将id_rsa.pub中的公钥信息保存到authorized_keys中.
chmod 600 ./authorized_keys # 修改文件授权.
压缩包的下载和解压
jdk压缩包的解压（注意在官网选择合适的.gz包，进行解压）
command：tar
在这里插入图片描述
hadoop压缩包的解压

环境的配置
需要在.bashrc文件中追加如下的环境配置

hadoop的文件配置：

1.core-site.xml文件的配置
默认情况下，Hadoop将数据保存在/tmp下，当重启系统时，/tmp中的内容将被自动清空，所以我们需要制定自己的一个Hadoop的目录，用来存放数据。另外需要配置Hadoop所使用的默认文件系统，以及Namenode进程所在的主机。
进行追加如下的配置
在这里插入图片描述
2.修改hdfs-site.xml配置文件
该文件指定与HDFS相关的配置信息。需要修改HDFS默认的块的副本属性，因为HDFS默认情况下每个数据块保存3个副本，而在伪分布式模式下运行时，由于只有一个数据节点，所以需要将副本个数改为1；否则Hadoop程序会报错。
进行追加如下的配置
在这里插入图片描述 3. mapred-site.xml配置
在该配置文件中指定与MapReduce作业相关的配置属性，需要指定JobTracker运行的主机地址。
因为hadoop默认配置文件中，只有mapred-site.xml.template，需要执行如下的命令
mv mapred-site.xml.template mapred-site.xml
在这里插入图片描述
4.修改yarn-site.xml配置文件

5.slaves
修改localhost 为 cyh

对hadoop集群进行格式化
执行如下的命令：
command：hadoop namenode -format

Hadoop启动

start.dfs.sh 开启hdfs进程
start.yarn.sh 开启yarn进程

执行jps命令
命令执行完成后输入jps命令若有5个进程：namenode、secondarynamenode、datanode、resourcemanager、nodemanager，则表示启动成功。
在这里插入图片描述

可以通过web访问http://ylitech:50070 查看NameNode和DataNode信息。
访问web界面：http://ylitech:8088 可以查看mapreduce运行情况。
至此hadoop伪分布式即安装成功。

远航ing

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop伪分布式搭建

第一步首先创建一个新的用户？为什么要创建一个新的用户？因为linux系统可以对不同的用户，赋予不同的权限，通过这种方式可以限制不同用户对linux系统的操作。创建一个新的用户？因为权限的问题使用root用户command：useradd username 增加用户command:passwd username 修改用户的密码修改本机的名字需要修改两个配置文件1./e...
复制链接

扫一扫