HBase PerformanceEvaluation机制分析

最新推荐文章于 2020-08-06 15:19:09 发布

bryceforphy

最新推荐文章于 2020-08-06 15:19:09 发布

阅读量3.6k

点赞数

分类专栏： hbase 文章标签： hbase 编码压测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bryce123phy/article/details/77905538

版权

本文深入探讨了HBase自带的性能测试工具PerformanceEvaluation，该工具通过多线程模拟多用户对集群的并发访问。通过运行hbase org.apache.hadoop.hbase.PerformanceEvaluation，可以了解其使用方式。工具中的scanRange10功能执行指定范围内的随机scan操作，startkey和endkey由totalRows内的随机数生成。

摘要由CSDN通过智能技术生成

本文我们来分析一下hbase自带的测试工具——performanceEvaluation。该工具是hbase自带的性能压测工具，基本原因是是用多线程模拟多用户同时访问集群的情况。

运行hbase org.apache.hadoop.hbase.PerformanceEvaluation，可以看到关于performanceEvaluation的用法介绍，如下图中所示：

介绍一下关键的几个参数：

-nomapred，mo mapreduce，加入此参数表示采用本地多线程的方式去读写数据，默认不加，此时本地启动mapreduce任务方式去测试；

-table，待测试的标明；

-rows，在本地多线程读写的模式下，指定每个线程处理的数据行数；

-startRow，每个线程操作的起始数据key；

-compression，-blockEncoding，前者指明了压缩方式，默认是NONE，后者指定了block的encoding策略，默认也是none；

-writeToWAL，写入数据时的WLog落盘策略，包括SYNC_WAL和SKIP_WAL两种；

-multiGet，在RandomRead中，如果指定大于1，则一次返回多条数据，默认一次返回一条；

-inmemory，会将数据尽量放在内存中，默认是false，也即读操作是从磁盘返回，为了保证pe能够准确获取测量结果，建议保持为false；

-presplit和-splitPolicy，两者搭配使用，用于对测试表进行预切割；

-filterAll，这个参数我的理解是在测试scan功能时，加上此参数，则server端scan出来的结果不再返回给client端，用于单纯测试server端的性能；

performanceEvaluation提供了如下几种测试用例：

</

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
HBase PerformanceEvaluation机制分析

本文我们来分析一下hbase自带的测试工具——performanceEvaluation。该工具是hbase自带的性能压测工具，基本原因是是用多线程模拟多用户同时访问集群的情况。运行hbase org.apache.hadoop.hbase.PerformanceEvaluation，可以看到关于performanceEvaluation的用法介绍，如下图中所示：介
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。