Apache Impala 介绍以及优劣处

Apache Impala是一款高效SQL查询工具,基于Hive但性能更快,采用内存计算,适用于交互式实时任务处理。它直接读取HDFS和HBase数据,避免MR,提供列式存储和数据本地化,兼容HiveSQL。Impala架构包括Statestore Daemon、Catalog Daemon和Impala Daemon,用于资源管理、元数据同步和查询执行。
摘要由CSDN通过智能技术生成

Apache Impala 介绍以及优劣处

-------------------------------------------------------------------------------------------------------- 东子
在这里插入图片描述

1.Impala基本介绍

impala是cloudera提供的一款高效率的sql查询工具,提供实时的查询效果,官方测试性能比hive快10到100倍,其sql查询比sparkSQL还要更加快速,号称是当前大数据领域最快的查询sql工具,

  • impala是参照谷歌的新三篇论文(Caffeine–网络搜索引擎、Pregel–分布式图计算、Dremel–交互式分析工具)当中的Dremel实现而来,其中旧三篇论文分别是(BigTable,GFS,MapReduce)分别对应我们即将学的HBase和已经学过的HDFS以及MapReduce。
  • impala是基于hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。
    2.Impala与Hive关系
  • impala是基于hive的大数据分析查询引擎,直接使用hive的元数据库metadata,意味着impala元数据都存储在hive的metastore当中,并且impala兼容hive的绝大多数sql语法。所以需要安装impala的话ÿ
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值