1 使用工具: hbase 自带的性能测试工具 PE
2 测试的场景:a 使用 snapyy 算法 , b 不使用 snappy算法
3 测试的数据量 15000000
4 执行命令:
a hbase pe --oneCon=true --valueSize=100 --compress=SNAPPY --rows=15000000 --autoFlush=true --presplit=64 randomWrite 2
b hbase pe --oneCon=true --valueSize=100 --compress=NONE --rows=15000000 --autoFlush=true --presplit=64 randomWrite 2
5 对比分析
算法 | 数据场景rows | 耗时(毫秒) | 保存到hadoop中的数据量 |
snappy |