Hadoop环境配置和运行测试程序

(1)Hadoop环境配置

①安装1个虚拟机,命名为vm1,作为NameNode使用,然后克隆生成另外3个虚拟机,命名分别为vm2,vm3,vm4,作为DataNode使用;
②修改每台虚拟机的ip地址,分别为191.168.122.101,191.168.122.102,191.168.122.103,191.168.122.104;
如在vm1中修改主机地址,命令如下:
在这里插入图片描述

配置如下:
在这里插入图片描述

重启网络服务:
在这里插入图片描述

③在每个结点上新建一个名为hadoop的用户,并设置密码;
在这里插入图片描述

④关闭每个结点的防火墙;
在这里插入图片描述

⑤配置ssh,实现结点之间用户的免密登录;
如在vm1中,生成密钥:
在这里插入图片描述

实现到vm2的免密登录:
在这里插入图片描述

实现到vm3的免密登录:
在这里插入图片描述

实现到vm4的免密登录:
在这里插入图片描述

在其他虚拟机中也执行相同的操作生成密钥,并实现到各虚拟机中的免密登录。
⑥安装配置JDK;
在4台虚拟机中新建目录/usr/java,将下载的jdk安装包解压到该目录下:
在这里插入图片描述

进入/etc/profile中,在文件末尾添加以下代码:
在这里插入图片描述

在这里插入图片描述

保存Java环境变量后,在命令行键入以下命令,使环境变量立即生效:
在这里插入图片描述

通过which命令测试jdk安装是否成功:
在这里插入图片描述

显示如上信息,说明jdk配置成功。
⑦将hadoop-2.4.1.tar.gz放置在vm1的/home/hadoop目录中,并对其进行解压;

在这里插入图片描述
在这里插入图片描述

⑧配置hadoop环境变量;
进入/etc/profile中,在文件末尾添加以下代码:
在这里插入图片描述
在这里插入图片描述

保存Java环境变量后,在命令行键入以下命令,使环境变量立即生效:
在这里插入图片描述

⑨修改Hadoop配置文件;
使用vim打开hadoop-env.sh文件,找到Java环境变量设置位置,将其改为jdk的安装位置:

在这里插入图片描述
在这里插入图片描述

使用vim打开core-site.xml文件,在<configuration></configuration>之间添加以下代码:
在这里插入图片描述
在这里插入图片描述

使用vim打开hdfs-site.xml文件,在<configuration></configuration>之间添加以下代码:在这里插入图片描述

由于没有mapred-site.xml文件,需要将mapred-site.xml.template文件复制一份并命名为mapred-site.xml:
在这里插入图片描述

使用vim打开mapred-site.xml文件,在<configuration></configuration>之间添加以下代码:
在这里插入图片描述
在这里插入图片描述

创建master文件,写入NameNode结点的主机名,这里为vm1,保存并退出:
在这里插入图片描述
在这里插入图片描述

使用vim打开slaves文件, 写入DataNode结点的主机名,这里为vm2、vm3、vm4,保存并退出:
在这里插入图片描述

在这里插入图片描述

⑩进入/etc/hosts文件中,添加hosts映射:
在这里插入图片描述

○11将配置好的Hadoop文件复制到其他结点并格式化;

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

格式化成功可以看到如下信息:
在这里插入图片描述

○12进入/home/hadoop/hadoop-2.4.1/sbin,执行start-all.sh脚本,启动Hadoop;
在这里插入图片描述

在NameNode(192.168.122.101)上输入jps命令查看启动进程情况:
在这里插入图片描述

在其他3个DataNode结点上输入jps命令查看启动进程情况:
在这里插入图片描述

至此,Hadoop已配置成功。
停止Hadoop:

在这里插入图片描述

(2)运行测试程序WordCount

①在hadoop用户当前目录下新建文件夹WordCount,在其中建立两个测试文件file1.txt,file2.txt:
在这里插入图片描述

file1.txt内容:
在这里插入图片描述

file2.txt内容:
在这里插入图片描述

②开启hdfs;
在这里插入图片描述
在这里插入图片描述

②在Hadoop文件系统HDFS中新建文件夹“input”,并查看其中的内容。
在这里插入图片描述

③将WordCount文件夹中file1.txt、file2.txt文件上传到刚刚创建的“input”文件夹;
在这里插入图片描述

④运行Hadoop的示例程序WordCount;
在这里插入图片描述

⑤查看输出结果的文件目录信息和WordCount的结果;

在这里插入图片描述
在这里插入图片描述

  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值