大数据:Hadoop集群测试

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


通过UI界面查看Hadoop运行状态

Hadoop集群正常启动后,它默认开放了两个端口9870和8088,分别用于监控HDFS集群和YARN集群。通过UI界面可以方便地进行集群的管理和查看,只需要在本地操作系统的浏览器输入集群服务的IP和对应的端口号即可访问:


一、hadoop2和hadoop3端口区别表

在这里插入图片描述

2、查看HDFS集群状态

在浏览器里访问 http://master:9870
在这里插入图片描述

不能通过主机名master加端口9870的方式,原因在于没有在hosts文件里IP与主机名的映射,现在只能通过IP地址加端口号的方式访问:http://浮动ip:9870
在这里插入图片描述

  • 单击导航条上的【Datanodes】,查看数据节点信息
    在这里插入图片描述

  • 访问slave1的数据节点(DataNode)
    在这里插入图片描述

  • 点开【Utilities - 实用工具】下拉菜单,选择【Browse the file system - 浏览文件系统】
    在这里插入图片描述

  • 此时HDFS上什么东东都木有
    在这里插入图片描述

  • 在HDFS上创建一个目录BigData,既可以在WebUI上创建,也可以通过shell命令创建

  • 执行命令:hdfs dfs -mkdir /BigData
    在这里插入图片描述

  • 在Hadoop WebUI界面查看刚才创建的目录
    在这里插入图片描述

  • 单击【BigData】右边的删除按钮

在这里插入图片描述

  • 查看四个功能按钮

在这里插入图片描述

  • 在Hadoop WebUI界面里创建目录
    在这里插入图片描述

查看YARN集群状态

  • 访问http://master:8088/cluster,从图中可以看出YARN集群状态显示正常
    在这里插入图片描述
  • 单击【About】链接
    在这里插入图片描述

Hadoop集群初体验 —— 词频统计

1、启动Hadoop集群

  • 在master虚拟机上执行命令:start-all.sh
    在这里插入图片描述

2、在虚拟机上准备文件

  • 在master虚拟机上创建test.txt文件
    在这里插入图片描述

3、文件上传到HDFS指定目录

  • 上传test.txt文件到HDFS的/BigData目录(如果没有就创建目录)
    在这里插入图片描述
  • 利用HDFS命令查看文件是否上传成功
    在这里插入图片描述
  • 利用Hadoop WebUI查看文件是否上传成功
    在这里插入图片描述

4、运行词频统计程序的jar包

  • 查看Hadoop自带示例的jar包
    在这里插入图片描述
  • 执行命令:hadoop jar ./hadoop-mapreduce-examples-3.3.4.jar wordcount
    /BigData/test.txt /wc_result
    在这里插入图片描述
  • 说明:作业编号 - job_1668566449679_0001,读取90个字节,写入60个字节
  • 查看输出目录/wc_result,执行命令:hdfs dfs -ls /wc_result
    在这里插入图片描述
  • 查看词频统计结果,执行命令:hdfs dfs -cat /wc_result/*
    在这里插入图片描述

5、在HDFS集群UI界面查看结果文件

  • 在HDFS集群UI界面,查看/wc_result目录
    在这里插入图片描述
  • 下载可查看
    在这里插入图片描述

6、在YARN集群UI界面查看程序运行状态

  • 访问http://master:8088,看到FINISHED和SUCCEEDED
    在这里插入图片描述
  • 单击应用标识application_1668566449679_0001(注意:每次运行同一个应用,应用标识会发生变化),查看应用的运行详情

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Hadoop完全分布式测试是一种测试Hadoop集群的方法,确保所有节点都能正常工作并且可以进行数据处理。以下是一些测试步骤: 1. 配置Hadoop集群。确保每个节点都正确安装了Hadoop,并且配置文件都指向正确的节点。 2. 启动Hadoop集群。使用start-all.sh脚本启动Hadoop集群,并确保所有节点都成功启动。 3. 创建HDFS目录。使用hadoop fs -mkdir命令在HDFS中创建一个目录,并确保所有节点都可以访问该目录。 4. 将文件上传到HDFS。使用hadoop fs -put命令将一个文件上传到HDFS,并确保所有节点都可以访问该文件。 5. 运行MapReduce作业。使用hadoop jar命令运行一个简单的MapReduce作业,并确保所有节点都能够成功处理数据。 6. 测试故障转移。在运行作业时,从集群中随机选择一个节点并关闭它。确保作业能够成功转移到其他节点并继续运行。 7. 测试数据完整性。在上传文件到HDFS后,使用hadoop fs -cat命令检查文件的内容是否与原始文件相同。 这些步骤可以确保Hadoop集群能够正常运行,并且可以处理和存储大量的数据。 ### 回答2: Hadoop完全分布式测试是指使用Hadoop进行大规模数据处理和分析的一种测试方式。Hadoop是一个开源的分布式计算框架,通过将数据分割为多个部分并并行处理,提供了高效的数据存储和处理能力。 在进行Hadoop完全分布式测试时,首先需要搭建Hadoop集群环境,包括Master节点和多个Slave节点。Master节点负责任务分配和监控,而Slave节点则用于实际的数据处理。 接下来,需要准备合适规模的测试数据。测试数据可以是模拟的虚拟数据,也可以是真实的生产数据。数据的规模应该足够大,以使得Hadoop能够充分发挥其并行处理的能力。 在进行完全分布式测试时,可以针对不同场景进行测试。例如,可以测试Hadoop在不同规模数据下的处理速度和性能表现,或者测试Hadoop在不同负载下的稳定性和可靠性。 测试完成后,需要对测试结果进行分析和评估。可以根据处理时间、资源利用率等指标来评估Hadoop的性能和效果。同时,还可以通过比较不同配置下的测试结果来优化Hadoop的配置,以提升其性能和效率。 需要注意的是,Hadoop完全分布式测试需要有一定的技术基础和经验,对Hadoop的配置和调优有一定的了解才能进行有效的测试。此外,测试过程中需要注意数据的备份和安全性,以免出现数据丢失或泄露的情况。 总结来说,Hadoop完全分布式测试是一种评估Hadoop性能和效果的重要方式,通过测试可以发现问题并进行优化,从而提升Hadoop在大规模数据处理中的应用效果。 ### 回答3: Hadoop是一种用于处理大数据的开源分布式计算框架。完全分布式测试是指在Hadoop集群中对其所有组件进行全面的测试,以确保其正常运行和高效处理大数据。 完全分布式测试包括对Hadoop的各个组件进行功能测试、性能测试和可靠性测试。 在功能测试中,我们将测试HDFS(Hadoop分布式文件系统)的文件读写操作是否正常,检查MapReduce的任务调度和执行过程是否正确。我们还会测试其他Hadoop生态系统组件,例如Hive(用于数据仓库和数据查询)、HBase(用于NoSQL数据库)等的功能是否正常。 性能测试是评估Hadoop集群的处理能力和性能瓶颈的过程。我们会使用大规模的数据集,在集群中运行多个并行的MapReduce任务,以测试系统在高负载情况下的处理速度和吞吐量。通过性能测试,我们可以找到系统的瓶颈,并对其进行优化,以提升处理效率。 可靠性测试是验证Hadoop集群对于硬件故障和网络中断等异常情况的容错性。我们会模拟集群中某个节点或多个节点的故障,并观察系统是否能够自动进行故障恢复,数据是否能够正确地在不同节点间复制和传输。通过可靠性测试,我们可以确保Hadoop集群在面临异常情况时也能保持稳定运行,并且数据不会丢失。 总之,Hadoop完全分布式测试是一个全面的测试过程,旨在验证Hadoop集群的功能、性能和可靠性。通过这些测试,我们可以确保Hadoop在处理大数据时,可以高效、可靠地运行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值