Hive提供了一个严格模式,用如下方式设置:
hive> set hive.mapred.mode=strict;
这种模式是为了防止一些可能产生意想不到的不好的结果的查询执行,在这种模式下,以下三种查询被禁止:
1.带有分区的表的查询
如果对一个有分区的Hive表进行查询,除非where条件里包含分区字段,否则无法执行。
进行这个限制的原因是,通常分区表数据量很大,不进行筛选可能会消耗意想不到的巨大资源。
2.带有order by的查询
带有order by的查询,必须有limit语句,因为orderby为了执行排序会将所有的结果分发到同一个reducer中进行处理,这个reducer可能会执行很长一段时间。
3.限制笛卡尔积的查询。
在关系数据库中,会对使用where而不是on筛选的join进行优化,将where转化为on,但是Hive中没有这种优化,因此不带on的话会可能出现意想不到的结果,Hive会禁止这种查询。