impala 羚羊 快
hive是一个ETL工具可以做报表统计分析,在hive里面写sql在将sql转换成MR程序,在找到yarn分配调度任务产生很多task就可以取hdfs上处理海量数据这样就比较慢
impala会向metastore读取元数据写sql语句基本和hql一样,还会在每台datanode上装一个impalad进程直接用内存读数据省略了转MR在yarn上调度的过程所以快了很多最后在聚合,lmpala是依附于hive的要读取hive\的元数据的两个是相辅相成的lmpala可以算及时的,hive可以算大量的
impala入门
最新推荐文章于 2021-02-25 00:20:55 发布