spark的性能测试

   一直在使用hive做分布式大数据查询工作,越来越发现做为一个离线查询数据库来说,这样的效率真的是让人抓狂啊。网上说spark的性能是非常优越的,所以做了个环境安装了个,在centos的虚拟机上跑一下,果然性能非常的好,这个真的是令人惊喜的,在大数据的今天,人们需要大数据,又需要高效的查询效率,spark真的满足了这个需求,希望spark越来越好,spark支持hive的sql语法,这样对于关系型数据库的使用者绝对是个福利。我取一个6000万的表的count,大概需要的时间是10分钟,如果是随机取top的话,更是秒查,非常的棒。发两个截图,mark一下。



取count的截图我就不展示了,要不还得等10分钟。但是spark做随机查询,效果真是不要不要的了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值