Hive 基础之:分区、桶、Sort Merge Bucket Join
Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了,虽然也有
Impala 等后起之秀,但目前从功能、稳定性等方面来说,Hive 的地位尚不可撼动。
其实这篇博文主要是想聊聊 SMB join 的,Join 是整个 MR/Hive 最为核心的部分之一,是每个Hadoop/Hive/DW
RD 必须掌握的部分,之前也有几篇文章聊到过 MR/Hive 中的 join
转载
2016-11-22 15:04:21 ·
854 阅读 ·
0 评论