hive
文章平均质量分 80
mm_bit
这个作者很懒,什么都没留下…
展开
-
hive中的分区表
分区表其实就是按照表中数据的某一列的值进行划分文件(自我理解类似于sql查询中的group by),一个分区下包含多个子目录,用于分区的虚拟列有多少种枚举值就有多少个子目录。分区表可以采用一个虚拟列进行分区,也可以采用多个虚拟列进行分区。分区是在处理大型事实表时常用的方法。分区的好处在于缩小查询扫描范围,从而提高速度。分区分为两种:静态分区static partition和动态分区dyna原创 2015-12-07 16:01:04 · 2255 阅读 · 0 评论 -
通过hive访问hbase中的表
在hbase中创建表后,我们只能在hbase shell中使用scan查询数据,这对于熟悉SQL的使用者不怎么习惯,不过我们可以在hive中创建外部表来访问hbase表中的数据,例子如下:1.这里hbase中的表oss_user_label_action_data已经存在=> #hbase(main):067:0> scan 'oss_user_label_action_dat转载 2016-07-19 16:58:49 · 1367 阅读 · 0 评论