Impala:
Cloudera公司推出,提供对于hdfs,hbase数据的高性能,低延迟的交互式sql 查询功能
基于hive,使用内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点
是CDH首选的PB级大数据实时查询,分析引擎。
内存计算比I/O计算要快,内存计算不依赖于磁盘,受制于内存大小,对于磁盘的要求更高。
Hive是基于MapReduce,内存可以很小。
Map阶段是一条一条的处理
Reduce是一组一组处理
硬件是要花钱的,软件是不要掏钱的&#
Impala:
Cloudera公司推出,提供对于hdfs,hbase数据的高性能,低延迟的交互式sql 查询功能
基于hive,使用内存计算,兼顾数据仓库,具有实时,批处理,多并发等优点
是CDH首选的PB级大数据实时查询,分析引擎。
内存计算比I/O计算要快,内存计算不依赖于磁盘,受制于内存大小,对于磁盘的要求更高。
Hive是基于MapReduce,内存可以很小。
Map阶段是一条一条的处理
Reduce是一组一组处理
硬件是要花钱的,软件是不要掏钱的&#