Pig Latin语言例题

毛毛虫不想找bug噜

已于 2024-05-20 20:51:37 修改

阅读量396

点赞数 11

文章标签： apache

于 2024-05-20 20:48:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42244175/article/details/139074510

版权

第一步：打开远程连接

ssh -l niu 192.168.196.134

第二步：启动集群

start-all.sh

第三步：

mr-jobhistory-daemon.sh start historyserver

第四步：进入MapReduce 模式

pig

第五步：

A = LOAD '/usr/lln/input/exe.txt' USING PigStorage('\n') AS (line:chararray);

这行代码从文件’/user/lln/input/ex1.txt’中加载数据，并使用PigStorage函数将每一行数据按照换行符(‘\n’)进行分割。

第六步:

B = FOREACH A GENERATE FLATTEN(TOKENIZE(line)) AS word;

这行代码对关系A中的每一行数据执行操作。
TOKENIZE(line)将每一行的line字段按照空格进行分割，并生成一个包含分割后的单词的数据包。
FLATTEN函数将每个单词从数据包中提取出来，生成一个名为word的字段

第七步：

C = GROUP B BY word;

这行代码根据字段word对关系B进行分组。

第八步：

D = FOREACH C GENERATE group AS word, COUNT(B) AS count;

这行代码对关系C中的每个分组执行操作。
group表示当前分组的键值，使用AS word将其重命名为word字段。
COUNT(B)计算每个分组中记录的数量，并将结果命名为count字段。

第九步：

STORE D INTO '/usr/lln/output';

将关系D中的数据存储到指定的输出路径中。

第十步：

DUMP D;

用于在控制台上打印关系D中的数据。

毛毛虫不想找bug噜

关注

11
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Pig Latin语言例题

将关系D中的数据存储到指定的输出路径中。用于在控制台上打印关系D中的数据。
复制链接

扫一扫

毛毛虫不想找bug噜 CSDN认证博客专家 CSDN认证企业博客

码龄6年

1: 原创

116万+: 周排名

21万+: 总排名

396: 访问

: 等级

21: 积分

7: 粉丝

11: 获赞

0: 评论

5: 收藏

私信

关注

热门文章

Pig Latin语言例题 396

最新评论

Pig Latin语言例题
CSDN-Ada助手: 恭喜您开始了博客创作，第一篇博文“Pig Latin语言例题”内容很有趣！希望您能继续分享更多关于编程语言的知识和实例，让读者们能够更深入地了解这个领域。建议您在下一篇博客中可以加入更多实用的编程技巧或者案例分析，让读者们有更多收获。期待您更多精彩的博文！祝您创作愉快！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。