pig:group by之后的其它统计方法一

 1 --测试Top N后的其它统计
 2 A = LOAD '/TraceParser/blackcore/' USING PigStorage() as (lk_id:chararray,host:chararray);
 3 --DUMP A;
 4 
 5 B = GROUP A BY lk_id;
 6 B = FOREACH B GENERATE group as lk_id,COUNT($1) as amount;
 7 --DUMP B;
 8 
 9 --TOP N的数据集
10 C = ORDER B BY amount DESC;
11 C = LIMIT C 5;
12 --DUMP C;
13 
14 --除TOP N后的数据集归并为其它
15 D = JOIN B BY lk_id LEFT OUTER,C BY lk_id;
16 --DESCRIBE D;
17 --DUMP D;
18 E = FILTER D BY C::lk_id is null OR C::lk_id == '';
19 --DUMP E;
20 E = FOREACH E GENERATE B::lk_id,B::amount;
21 --DESCRIBE E;
22 --SUM的用法?
23 
24 --DUMP E;
25 --DUMP A;
26 H = JOIN E BY B::lk_id,A BY lk_id;
27 DESCRIBE H;
28 --H: {E::B::lk_id: chararray,E::B::amount: long,A::lk_id: chararray,A::host: chararray}
29 --DUMP H;
30 I = GROUP H all;
31 I = FOREACH I GENERATE '其它',COUNT($1) as amount;
32 DUMP I;

转载于:https://www.cnblogs.com/blackcore/p/3382143.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值