【Spark benchmark】 NMON 和 BigDataBench测试

最新推荐文章于 2024-05-27 09:58:09 发布

luonango

最新推荐文章于 2024-05-27 09:58:09 发布

阅读量3.5k

点赞数

分类专栏： hadoop 文章标签： spark benchmark bigdatabench NMON 基准测试

本文链接：https://blog.csdn.net/u012587561/article/details/52166851

版权

5 篇文章 0 订阅

订阅专栏

Benchmark测试：NMON + BigDataBench

一、 NMON监控、分析系统性能

1. 在Linux中使用apt-get install nmon安装

2. 输入nmon显示下面页面表示安装成功

3. 生成报表: 如 nmon –s2 –c1800 –f –m~/code/tmp/benchmark
-s2 每 2 秒采集一次数据。
-c1800 采集 1800 次，即为采集十分钟的数据。
-f 生成的数据文件名中包含文件创建的时间。
-m 生成的数据文件的存放目录。

4. 生成性能报告表格文档：

使用nmon analyser_v34a.xls文件，传入上述报表文件，即可生成性能报表，如下图：

1. 下载BigDataBench_V3.2.5_Spark.tar.gz并解压到相应文件夹

2. 按着本机的jdk、hadoop、scala、spark等配置conf_properties文件

3. 编译源码，执行sudo ./prepar.sh

1. 进入MicroBenchmarks文件夹，运行genData_MicroBenchmarks.sh:

sh genData_MicroBenchmarks.sh (采用bash而非dash)

2. 输入想生成的数据大小，等待片刻即可在./MicroBenchmarks/data-MicroBenchmarks中找到新生成的数据文件。

3. 将生成的数据放入HDFS中(该过程在生成数据后自动执行，可在hdfs的/data-MicroBenchmarks可看到上传的文件)

4. 执行run_MicroBnechmarks.sh即可测spark中的sort、gerp、wordcount函数性能。

1. 准备好测试数据(1G，两个文件，由上述genData_MicroBenchmarks.sh生成)

2. 在每台主机中进行NMON监控（采集60分钟内数据，2秒采集一次）：

输入命令：nmon -s2 -c1800 -f -m~/code/tmp/benchmark

3. 准备好时间登记

时间安排（2016年8月1日10：59 - 11：59）

10：59：00	三台主机启动nmon监控
11：00：00	Master启动Hadoop集群
11：01：00	Hadoop集群启动完毕
11：03：00	启动tachyon集群(SudoMount方式)
11：03：40	Tachyon集群启动完成
11：05：00	启动spark集群
11：05：15	Spark集群启动完毕
11：06：50	启动spark-shell(集群方式)
11：07：45	Spark-shell启动完成
11：15：00	HDFS中删除1G的文件
11：15：10	删除完成
11：20：00	Spark集群排序Sort测试
11：20：20	程序报错（环境变量未设置好）
11：21：30	Spark集群排序Sort测试
11：26：15	排序完成
11：34：00	打开FireFox浏览器进行查看HDFS及集群情况
11：36：10	关闭FireFox
11：41：00	Spark集群Grep测试
11：43：30	Grep测试完毕
11：45：00	Spark集群WordCount测试
11：46：30	WordCount测试完成
11：49：00	Spark-shell集群退出
11：50：00	关闭Spark集群
11：51：00	关闭tachyon
11：52：00	关闭Hadoop集群