其实普通全表查询—不需要走MR
例如:select * from 表名 ,这是通过对文件进行filter过滤就可以实现查询
count、sum、avg、group、max、min等聚合函数—是一定会走MR的
【注意:配置简单查询不走MR的方式】
在hive-site.xml里面有个配置参数:hive.fetch.task.conversion
将这个参数设置为more,简单查询就不走map/reduce了,设置为minimal,就任何简单select都会走map/reduce
不走MR的各种情况:
1、等值判断
select * from table_a where name = “Tom”;
2、不等值判断
select * from table_a where age<>18;
3、模糊查询
select * from table_a where name like “%和%”;
4、空、非空值判断
select * from table_a where name is null;
5、大于、小于
select * from table_a where id>5;