集群模式:Yarn,每个task(map 和reduce )都各自运行在一个JVM中,每个任务都是一个进程。
本地模式:local model,所有任务,都是运行在一个进程里面的
目的:为了hive CLi中方便测试,采取设置hive运行模式
set hive.exec.mode.local.auto=true;
如果设置为true,hive框架会自动根据需要处理的数据大小,去决定是否跑本地模式。(本地速度会很快)
默认情况是跟你就Block大小去决定。
处理的数据<128Mb或者MapTask个数<= 5个,本地
1)方式一:hive Cli设置(仅仅本次会话有效)
在hive 交互式命令行中:set hive.exec.mode.local.auto=true;
2)方式二:hive-site.xml配置文件中
所有会话,所有程序都生效
<property>
<name> hive.exec.mode.local.auto</name>
<value>true</value>
</property>