hive
文章平均质量分 77
huangxiaoxun235
这个作者很懒,什么都没留下…
展开
-
hive分桶
hive分桶和抽样查询 1.概念 桶是比表或分区更为细粒度的数据范围划分。针对某一列进行桶的组织,对列值哈希,然后除以桶的个数求余,决定将该条记录存放到哪个桶中。 物理上,一个桶就是表(或分区)目录里的一个文件。桶对应于MapReduce的输出文件分区:一个作业产生的桶(输出文件)和reduce任务个数相同 2.创建语句 create table bucketed_user(id int转载 2017-06-16 10:33:04 · 496 阅读 · 0 评论 -
hive表权限管理
hive表权限管理转载 2017-06-14 17:57:45 · 9653 阅读 · 0 评论 -
hive常用语句
1.导入有分区的数据:oracle语句 select * from xx partition("FMLG_PART_${dateStr:0:6}") where \$CONDITIONS " 2.增量导入关系型数据库orcle的where语句表达式 select * from xx WHERE D_UPDATE >= to_date('20170423','yyyymmdd')原创 2017-06-15 10:14:02 · 1944 阅读 · 0 评论