Hive ROW_NUMBER,RANK(),DENSE_RANK()

Hive ROW_NUMBER,RANK(),DENSE_RANK()

准备数据

浙江,杭州,300

浙江,宁波,150

浙江,温州,200

浙江,嘉兴,100

江苏,南京,270

江苏,苏州,299

江苏,某市,200

江苏,某某市,100

 

创建表

CREATE table pcp

(province string,city string,people int)

ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

STORED AS TEXTFILE;

 

导入数据

load data inpath '/tmp/1.txt' into table pcp;

 

普通查询

select * from pcp order by people desc;

浙江    杭州    300

浙江    宁波    150

浙江    温州    200

浙江    嘉兴    100

江苏    南京    270

江苏    苏州    299

江苏    某市    200

江苏    某某市    100

 

 

综合查询

select province,city,

rank() over (order by people desc) rank,

dense_rank() over (order by people desc) dense_rank,

row_number() over(order by people desc) row_number

from pcp

group by province,city,people;

 

浙江    杭州    300    1    1    1

江苏    苏州    299    2    2    2

江苏    南京    270    3    3    3

江苏    某市    200    4    4    4

浙江    温州    200    4    4    5

浙江    宁波    150    6    5    6

江苏    某某市    100    7    6    7

浙江    嘉兴    100    7    6    8

 

主要注意打圈的:

 row_number顺序下来,

rank:在遇到数据相同项时,会留下空位,(红框内第一列,4,4,6)

dense_rank:在遇到数据相同项时,不会留下空位,(红框内第一列,4,4,5)

 

分组统计查询

select province,city,

rank() over (partition by province order by people desc) rank,

dense_rank() over (partition by province order by people desc) dense_rank,

row_number() over(partition by province order by people desc) row_number

from pcp

group by province,city,people;

江苏    苏州    299    1    1    1

江苏    南京    270    2    2    2

江苏    某市    200    3    3    3

江苏    某某市    100    4    4    4

浙江    杭州    300    1    1    1

浙江    温州    200    2    2    2

浙江    宁波    150    3    3    3

浙江    嘉兴    100    4    4    4

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值