大数据
hive,spark
短迪大魔王
这个作者很懒,什么都没留下…
展开
-
pyspark
我们去关注这个人,他的pyspark写的很好。原创 2020-11-20 16:58:36 · 219 阅读 · 0 评论 -
hive
单独使用groupbyselect max(cate_id) as cate_id,count(cate_id) as numfrom hdp_mis_yxzn_defaultdb.vip_cate_title_dy2mvwhere partition_dt=‘20180817’group by cate_idorder by num descLIMIT 1000select后的内容只能是groupby的内容以及该内容的统计量。如果想要对某些字段进行联合排序,且select后面出现更多的内容原创 2020-11-02 15:24:33 · 211 阅读 · 0 评论