Impala
impala 是 cloudera 提供的一款高效率的 sql 查询工具,提供实时的查询效果,官方测试性能比 hive 快 10 到 100 倍,其 sql 查询比 sparkSQL 还要更加快速, 号称是当前大数据领域最快的查询 sql 工具。
impala 是参照谷歌的新三篇论文(Caffeine–网络搜索引擎、 Pregel–分布式图计算、 Dremel–交互式分析工具)当中的 Dremel 实现而来,其中旧三篇论文分别是(BigTable, GFS, MapReduce)分别对应我们即将学的 HBase 和已经学过的 HDFS 以及 MapReduce。
impala 是基于 hive 并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点。
Impala shell
-
impala shell 外部命令
指不需要进入到 impala-shell 交互命令行当中即可执行的命令参数。
在启动 impalashell 时设置,用于修改命令执行环境。
impala-shell -h 可以帮助我们查看帮助手册 impala-shell -r 刷新 impala 元数据, 与建立连接后执行 REFRESH 语句 效果相同 impala-shell -f 执行指的的 sql 查询文件。 impala-shell -i 指定连接运行 impalad 守护进程的主机。默认端口是 21000。可以连接到集群中运行 impalad 的任意主机。 impala-shell -o 保存执行结果到文件当中去
-
impala shell 内部命令
指进入 impala-shell 命令行之后