hadoop性能测试

从搭建hadoop环境到测试完成大概用了8,9天的时间,总的来说,hadoop上手还是比较容易的,只是内部确实有点复杂。

测试环境部署用了22台机器,CPU 16核,感觉有点浪费。

日志每分钟往hdfs写600M的log,每五分钟提交一次hadoop任务,大概一个任务处理2G多点的文件,测试结果,到reduce 完成时间大概是1分9- 1分30秒之间,大概是开了90多个map, 这在以前pc上是不可想象的速度,后来自己稍微改进了下,加了combine,效率大大提升, 每次都是20秒左右就完成了,大概只有原来的1/4左右的时间,主要 combine

是本地map的同时完成reduce,然后再将reduce 的结果汇总做一次reduce,等于集群22台机器都做了map和reduce, 原来只是一台做reduce。

下个星期准备研究下comparaor,到时候再做个性能比较,可能同时还得搭个Twitter的storm的测试环境,一个是实时的, 一个非实时的。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值