Impala
文章平均质量分 67
# Impala
学要无止尽
任职于达摩院自动驾驶实验室;负责自动驾驶云端计算的架构和研发;
展开
-
Impala与Hive的比较
1. Impala架构 Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分组成),可以直接从转载 2013-11-25 14:14:10 · 1835 阅读 · 0 评论 -
Impala入门笔记
问题背景:初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的:了解Impala的安装过程初步了解Impala的使用比较Impala与Hive的性能测试适合阅读对象:想了解Impala安装的读者想了解Impala与Hive性能比较的读者不涉及的内容:如何安装H转载 2013-11-25 14:25:58 · 1070 阅读 · 0 评论 -
Impala 表使用 Parquet 文件格式
目录[-]Impala 表使用 Parquet 文件格式在 Impala 中创建 Parquet 表加载数据到 Parquet 表Impala Parquet 表的查询性能Parquet 表的分区Parquet 数据文件的 Snappy 和 GZip 压缩使用 Snappy 压缩的 Parquet 表使用 GZip 压缩的 Parquet 表未压缩的 P转载 2014-04-12 12:04:23 · 7956 阅读 · 0 评论 -
Impala 使用的端口
下表中列出了 Impala 是用的 TCP 端口。在部署 Impala 之前,请确保每个系统上这些端口都是打开的。组件服务端口访问需求备注Impala DaemonImpala 守护进程前端端口21000外部被 impala-shell, Beeswa原创 2014-06-16 12:20:29 · 12096 阅读 · 0 评论