impala 大数据的核心思想是:分而治之,计算向数据移动。 hive是如何进行大数据计算的?hive本身不会不会进行计算的,hive会将sql转化为map/reduce来进行大数据计算的。 使用map/reducer的shuffle的特点:采用的是基于序列化的环形字节数组来进行存储。 impala的原理 impala的架构图: impala shell 在这里插入图片描述 Oozie