Pig简单使用

6.Pig是一个利用mapreduce进行计算框架。有自己的一套语法PIG latin,可以非常方便的书写计算代码。

7.如何使用pig?

  解压缩之后,修改文件conf/pig.properties,增加两行内容,如下

  fs.default.name=hdfs://hadoop0:9000

  mapred.job.tracker=hadoop0:9001

  保存退出后,执行bin/pig进入命令行

8.使用pig完成电信手机号码统计流量

  #加载hdfs中的数据

  A = LOAD '/kpi' AS (f0:chararray,f1:chararray, f2:chararray, f3:chararray, f4:chararray, f5:chararray, f6:long,f7:long, f8:long, f9:long, f10:chararray);

  #过滤A中有用的字段

  B = FOREACH A GENERATE f1,f6,f7,f8,f9;

  #对B中的记录按照f1进行分组

  C = GROUP B BY f1;

  #对分组后的记录,按照分组字段进行累加

  D = FOREACH C GENERATE group,SUM(B.f6),SUM(B.f7),SUM(B.f8),SUM(B.f9);

  #把最后的结果保持到HDFS中

  STORE D INTO '/out';

 

9.以上的pig命令可以放到一个文件中执行,执行方式是pig kpi.pig

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值