Hive基于MR/Tez/本地模式的对比

实验环境

内存:16GB
CPU:i5 4590
Centos:6.8
Hive:2.3.6

实验数据

数据量:1138526
字段:3个

实验目的

对比Hive on MR 与 Hive on Tez 以及Hive本地模式在不同语句下的执行效率对比

实验结论

省去看实验过程的麻烦
在这里插入图片描述

  1. 本地模式肉眼可见,效果极佳,但是对硬件和内存有一定要求,无法处理大数据量
  2. Tez优势是将具有依赖的多个作业转换成一个作业,从而减少与HDFS的交互,达到提升效率的目的。
  3. count和排序优化效果不好的原因是什么——尚未找到合理的解释
    1. 最初猜想是Tez是将多个作业转换为1个作业,但原本mr的个数就是1效果就没有提高,但表中group by效果是有提高的
    2. 随后猜想是tez中map和reduce个数明显增加导致的,但是在其他查询语句中都有增加

实验过程

count(*)

语句:select count(*) from youtube

MR:
Stage-Stage-1: Map: 1 Reduce: 1 Cumulative CPU: 3.27 sec HDFS Read: 33613985 HDFS Write: 8 SUCCESS
Total MapReduce CPU Time Spent: 3 seconds 270 msec
OK
_c0
1138562
Time taken: 35.19 seconds, Fetched: 1 row(s)

Local:
Stage-Stage-1: HDFS Read: 67225364 HDFS Write: 146047738 SUCCESS
Total MapReduce CPU Time Spent: 0 msec
OK
_c0
1138562
Time taken: 3.294 seconds, Fetched: 1 row(s)

Tez:<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值