Pig Latin语言例题

第一步:打开远程连接

ssh -l niu 192.168.196.134

第二步:启动集群

start-all.sh

第三步:

mr-jobhistory-daemon.sh start historyserver

第四步:进入MapReduce 模式

pig

第五步:

A = LOAD '/usr/lln/input/exe.txt' USING PigStorage('\n') AS (line:chararray);
  • 这行代码从文件’/user/lln/input/ex1.txt’中加载数据,并使用PigStorage函数将每一行数据按照换行符(‘\n’)进行分割。

第六步:

B = FOREACH A GENERATE FLATTEN(TOKENIZE(line)) AS word;
  • 这行代码对关系A中的每一行数据执行操作。
  • TOKENIZE(line)将每一行的line字段按照空格进行分割,并生成一个包含分割后的单词的数据包。
  • FLATTEN函数将每个单词从数据包中提取出来,生成一个名为word的字段

第七步:

C = GROUP B BY word;
  • 这行代码根据字段word对关系B进行分组。

第八步:

D = FOREACH C GENERATE group AS word, COUNT(B) AS count;
  • 这行代码对关系C中的每个分组执行操作。
  • group表示当前分组的键值,使用AS word将其重命名为word字段。
  • COUNT(B)计算每个分组中记录的数量,并将结果命名为count字段。

第九步:

STORE D INTO '/usr/lln/output';

将关系D中的数据存储到指定的输出路径中。

第十步:

DUMP D;

用于在控制台上打印关系D中的数据。

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值