大数据开发面试:Impala的优缺点

Impala的优缺点

优点:

1、基于内存进行计算,能够对PB级数据进行交互式实时查询、分析

2、无需转换为MR,直接读取HDFS数据

3、C++编写,LLVM统一编译运行(impala是用C++语言写的,不是用java语言写的)

4、兼容HiveSQL

5、具有数据仓库的特性,可对hive数据直接做数据分析

6、支持Data Local

7、支持列式存储(hbase是列式存储)(关系型数据库,hive,hbase,nosql数据库)(关系型数据库按照行存储,【也可以按照列存储】)

8、支持JDBC/ODBC远程访问

 

缺点:

1、对内存依赖大

2、C++编写  开源?!

3、完全依赖于hive

4、实践过程中  分区超过1w  性能严重下降  

5、稳定性不如hive

没有更多推荐了,返回首页