hadoop伪分布式搭建

第一步首先创建一个新的用户?为什么要创建一个新的用户?
因为linux系统可以对不同的用户,赋予不同的权限,通过这种方式可以限制不同用户对linux系统的操作。

创建一个新的用户?因为权限的问题使用root用户
command:useradd username 增加用户
在这里插入图片描述
command:passwd username 修改用户的密码
在这里插入图片描述
修改本机的名字
需要修改两个配置文件
1./etc/hostname
将localhost修改成为hadoop
2./etc/hosts
在文件后面追加本机的ip地址和主机名
在这里插入图片描述
hosts配置文件内容为
在这里插入图片描述
配置无密码登录
cd ~/.ssh
ssh-keygen -t rsa # 通过ssh-keygen命令来生成密钥对在.ssh目录下(会有提示,回车即可)。
cat id_rsa.pub >> authorized_keys # 将id_rsa.pub中的公钥信息保存到authorized_keys中.
chmod 600 ./authorized_keys # 修改文件授权.
压缩包的下载和解压
jdk压缩包的解压(注意在官网选择合适的.gz包,进行解压)
command:tar
在这里插入图片描述
hadoop压缩包的解压
在这里插入图片描述
环境的配置
需要在.bashrc文件中追加如下的环境配置
在这里插入图片描述
hadoop的文件配置:
在这里插入图片描述
1.core-site.xml文件的配置
默认情况下,Hadoop将数据保存在/tmp下,当重启系统时,/tmp中的内容将被自动清空,所以我们需要制定自己的一个Hadoop的目录,用来存放数据。另外需要配置Hadoop所使用的默认文件系统,以及Namenode进程所在的主机。
进行追加如下的配置
在这里插入图片描述
2.修改hdfs-site.xml配置文件
该文件指定与HDFS相关的配置信息。需要修改HDFS默认的块的副本属性,因为HDFS默认情况下每个数据块保存3个副本,而在伪分布式模式下运行时,由于只有一个数据节点,所以需要将副本个数改为1;否则Hadoop程序会报错。
进行追加如下的配置
在这里插入图片描述3. mapred-site.xml配置
在该配置文件中指定与MapReduce作业相关的配置属性,需要指定JobTracker运行的主机地址。
因为hadoop默认配置文件中,只有mapred-site.xml.template,需要执行如下的命令
mv mapred-site.xml.template mapred-site.xml
在这里插入图片描述
4.修改yarn-site.xml配置文件
在这里插入图片描述
5.slaves
修改localhost 为 cyh

对hadoop集群进行格式化
执行如下的命令:
command:hadoop namenode -format

Hadoop启动

start.dfs.sh 开启hdfs进程
start.yarn.sh 开启yarn进程

执行jps命令
命令执行完成后输入jps命令若有5个进程:namenode、secondarynamenode、datanode、resourcemanager、nodemanager,则表示启动成功。
在这里插入图片描述

可以通过web访问http://ylitech:50070 查看NameNode和DataNode信息。
访问web界面:http://ylitech:8088 可以查看mapreduce运行情况。
至此hadoop伪分布式即安装成功。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值