hive
文章平均质量分 77
huangxiaoxun235
这个作者很懒,什么都没留下…
展开
-
hive分桶
hive分桶和抽样查询1.概念桶是比表或分区更为细粒度的数据范围划分。针对某一列进行桶的组织,对列值哈希,然后除以桶的个数求余,决定将该条记录存放到哪个桶中。物理上,一个桶就是表(或分区)目录里的一个文件。桶对应于MapReduce的输出文件分区:一个作业产生的桶(输出文件)和reduce任务个数相同2.创建语句create table bucketed_user(id int转载 2017-06-16 10:33:04 · 483 阅读 · 0 评论 -
hive表权限管理
hive表权限管理转载 2017-06-14 17:57:45 · 9578 阅读 · 0 评论 -
hive常用语句
1.导入有分区的数据:oracle语句select * from xx partition("FMLG_PART_${dateStr:0:6}") where \$CONDITIONS "2.增量导入关系型数据库orcle的where语句表达式select * from xx WHERE D_UPDATE >= to_date('20170423','yyyymmdd')原创 2017-06-15 10:14:02 · 1919 阅读 · 0 评论