- 博客(1)
- 收藏
- 关注
原创 hive的strict模式;where,group by,having,order by同时使用的执行顺序
主要限制三种情况(1) 有partition的表查询需要加上where子句,筛选部分数据实现分区裁剪,即不允许全表全分区扫描,防止数据过大(2) order by 执行时只产生一个reduce,必须加上limit限制结果的条数,防止数据量过大造成1个reduce超负荷(3) join时,如果只有一个reduce,则不支持笛卡尔积查询。也就是说必须要有on语句的关联条件,做自然连接。
2015-11-02 18:00:13 6564
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人