Impala学习笔记一

  1. Impala是由Cloudera公司开发的新型的查询系统。
  2. Impala适用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询执行引擎,是一个开源软件,由C++和Java编写的。
  3. 和hadoop的SQL引擎比较,它提高了高性能和低延迟。
  4. 相比较Hive查询引擎来说,用户可以更快的使用SQL与HDFS和HBASE进行交互查询。
  5. Impala可以读取Hadoop使用的几乎所有的文件格式:Parquet,Avro,RDFile等
  6. 与Hive相比不同的还有,Impala不是基于MR算法,从而减少了MapReduce的延迟,所以使得Impala查询速度更加的快,比Hive快很多。
  7. Impala支持内存中的数据处理,它访问或者分析存储在Hadoop数据节点上的数据,而无需数据移动。
  8. Impala为HDFS中的数据提供了更快的访问。
  9. Impala使用的是Hive的元数据,ODBC驱动程序和SQL语法。
  10. Impala使用的与Hive相同的查询语言,元数据和用户界面。
  11. Impala是一个管理,分析存储在Hadoop上的数据的一个工具。
  12. Impala 的缺点是不提供任何对序列化和反序列化的支持,且只能读取文本文件,而不能读取二进制文件;每当新的记录或者文件被添加到HDFS中的数据目录时,该表需要被刷新。
  13. Hive适用的场景一般是跑批量数据,而Impala是实时交互场景更适用。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值