hive hsq中的group by & Distribute by & partition by & cluster by & partitioned by & clustered by

group by & partition by & Distribute by 首先一定要记住group by分组之后是会组内聚合的而后两者仅仅是分组了,并未有聚合操作

partition by是分区 Distribute by 可以理解为分簇

partition by是分区 区内排序用order by

Distribute by 可以理解为分簇 簇内排序用sort by 另外当 distribute by sorts by 后的字段相同时,可以使用 cluster by 方式

 

partitioned by (分区名 string) 按所分区名分区建表使用

clustered by(列名)  按列分桶建表使用

 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值