Impala总结与优化

本文介绍了Impala作为CDH平台的实时查询引擎,其特点包括内存计算、无需转换为MR、兼容HiveSQL等。同时,文章提到了Impala的劣势,如内存依赖大、依赖Hive等,并详细阐述了其核心组件的功能。此外,还分享了Impala SQL的创建表、视图操作及与HBase的整合方法,并提出了性能优化建议,如SQL优化、选择合适文件格式和利用分区技术。
摘要由CSDN通过智能技术生成

Impala是Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。
•基于Hive使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点
•是CDH平台首选的PB级大数据实时查询分析引擎
Impala的特点:  
   1、基于内存进行计算,能够对PB级数据进行交互式实时查询、分析
   2、无需转换为MR,直接读取HDFS数据
   3、C++编写,LLVM统一编译运行
   4、兼容HiveSQL
   5、具有数据仓库的特性,
   6、可对hive数据直接做数据分析
   7、支持列式存储
   8、支持Data Local
   9、支持JDBC/ODBC远程访问
Impala劣势:
    1、对内存依赖大
    2、C++编写 开源
    3、共生完全依赖hive一挂解千愁
    4、

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值