在hive学习(3)--- 较大数据下的hql执行速度中提到了不同hql会导致不同的执行速度,和不同的job数,同时也会存在不同job中,不同slaver的负载不一致,也就是所谓的数据倾斜,所以在这里专门探索下hive根据hql生成job和MP程序的原理或规则。
在hive学习(3)--- 较大数据下的hql执行速度中提到了不同hql会导致不同的执行速度,和不同的job数,同时也会存在不同job中,不同slaver的负载不一致,也就是所谓的数据倾斜,所以在这里专门探索下hive根据hql生成job和MP程序的原理或规则。