hive参数hive.mapred.mode分析

Hive配置中有个参数hive.mapred.mode,分为nonstrict,strict,默认是nonstrict

如果设置为strict,会对三种情况的语句在compile环节做过滤:

1. 笛卡尔积Join。这种情况由于没有指定reduce join key,所以只会启用一个reducer,数据量大时会造成性能瓶颈

[java]  view plain copy print ?
  1. // Use only 1 reducer in case of cartesian product  
  2. if (reduceKeys.size() == 0) {  
  3.   numReds = 1;  
  4.   
  5.   // Cartesian product is not supported in strict mode  
  6.   if (conf.getVar(HiveConf.ConfVars.HIVEMAPREDMODE).equalsIgnoreCase(  
  7.       "strict")) {  
  8.     throw new SemanticException(ErrorMsg.NO_CARTESIAN_PRODUCT.getMsg());  
  9.   }  
  10. }  

2. order by后面不跟limit。order by会强制将reduce number设置成1,不加limit,会将所有数据sink到reduce端来做全排序。

[java]  view plain copy print ?
  1. if (sortExprs == null) {  
  2.   sortExprs = qb.getParseInfo().getOrderByForClause(dest);  
  3.   if (sortExprs != null) {  
  4.     assert numReducers == 1;  
  5.     // in strict mode, in the presence of order by, limit must be specified  
  6.     Integer limit = qb.getParseInfo().getDestLimit(dest);  
  7.     if (conf.getVar(HiveConf.ConfVars.HIVEMAPREDMODE).equalsIgnoreCase(  
  8.         "strict")  
  9.         && limit == null) {  
  10.       throw new SemanticException(generateErrorMessage(sortExprs,  
  11.             ErrorMsg.NO_LIMIT_WITH_ORDERBY.getMsg()));  
  12.     }  
  13.   }  
  14. }  


3. 读取的表是partitioned table,但没有指定partition predicate。

注:如果是多级分区表的话,只要出现任何一个就放行

[java]  view plain copy print ?
  1. // If the "strict" mode is on, we have to provide partition pruner for  
  2. // each table.  
  3. if ("strict".equalsIgnoreCase(HiveConf.getVar(conf,  
  4.     HiveConf.ConfVars.HIVEMAPREDMODE))) {  
  5.   if (!hasColumnExpr(prunerExpr)) {  
  6.     throw new SemanticException(ErrorMsg.NO_PARTITION_PREDICATE  
  7.         .getMsg("for Alias \"" + alias + "\" Table \""  
  8.             + tab.getTableName() + "\""));  
  9.   }  
  10. }  

这三种case在数据量比较大的情况下都会造成生成低效的MR Job,影响执行时间和效率,不过直接抛出exception又感觉太forcefully了。

可以在一些非线上生产环境下的ad-hoc查询端中开启strict mode,比如hiveweb,运营工具。


本文链接http://blog.csdn.net/lalaguozhe/article/details/12044181,转载请注明

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值