Hive 分组排序
了解Hive中Order by 、Sort by的用法以及区别
本文数据源下载:
链接:https://pan.baidu.com/s/1MERWCWSOrWmvmZhIAGwB_w
提取码:v3x8
Order by的演示
在Hive中创建一个goods_visit表,有goods_id ,click_num 2个字段,字符类型都为string,以‘\t’为分隔符。
create table goods_visit(goods_id string,click_num int)
row format delimited fields terminated by '\t' stored as textfile;
将本地 /data/hive4下的表goods_visit中数据导入到Hive中的goods_visit表中
load data local inpath'/data/hive4/goods_visit' into table goods_visit;
使用Order by对商品点击次数从大到小排序,并通过limit取出10条数据:
select * from goods_visit order by click_num desc limit 10;
Sort by 的演示
将Reduce个数设置为三个:
se