mapper

最新推荐文章于 2024-07-14 12:46:09 发布

future_bloom

最新推荐文章于 2024-07-14 12:46:09 发布

阅读量47

点赞数

文章标签： hadoop hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jjgii/article/details/133965060

版权

#-*- coding:utf-8 -*-
#!/usr/bin/env python
import sys
#读取输入的文件
for line in sys.stdin:
#去除开头与结尾的空格
    line = line.strip()
#把每行单词切开，输出<word> 1
    words = line.split()
    for word in words:
        print '%s\t%s' % (word, 1)

#-*- coding:utf-8 -*-
#!/usr/bin/env python
import sys
word2count = {}
#文件会读取mapper.py 的结果作为reducer.py 的输入
for line in sys.stdin:
    #去除头尾空格
    line = line.strip()
    #按照Tab键进行切分
    word, count = line.split('\t', 1)
    try:
        count = int(count)
        word2count[word] = word2count.get(word, 0) + count
    except ValueError:  #count如果不是数字的话，直接忽略掉
        pass
#读取数据并筛选含有“Hadoop”的单词，把最终的结果输出到STDOUT。
for word, count in word2count.items():
    if word == 'Hadoop':
        print '%s\t%s'% (word, count)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
mapper

【代码】mapper。
复制链接

扫一扫

future_bloom CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

144万+: 周排名

14万+: 总排名

2278: 访问

: 等级

115: 积分

20: 粉丝

35: 获赞

5: 评论

31: 收藏

私信

关注

热门文章

最新评论

【无标题】
CSDN-Ada助手: 恭喜您写了第7篇博客！虽然这篇博客没有标题，但内容依然精彩让人流连忘返。希望您能继续坚持创作，为读者带来更多的精彩内容。建议您在下一篇博客中尝试添加一个有趣的标题，让读者一眼就被吸引。期待您的下一篇作品！祝您创作顺利！
修改后的mapper
CSDN-Ada助手: 恭喜您写完了第5篇博客！标题中的“修改后的mapper”听起来很有技术含量。您一直保持创作的动力和热情真令人钦佩。在下一步的创作中，或许您可以考虑结合实际应用场景，分享一些关于mapper的实践经验，或者提供一些与该主题相关的进阶技巧和注意事项。期待您的下一篇博客，谦虚的你一定会有更多精彩的创作！加油！
使用hadoop streaming 运行python脚本
CSDN-Ada助手: 恭喜您写出了第一篇博客！标题“使用hadoop streaming 运行python脚本”非常吸引人，展示了您对于hadoop streaming和python脚本的深入理解。我期待着在接下来的博客中看到更多关于这个主题的深入探讨。或许您可以考虑分享一些实际案例，介绍如何解决一些常见的问题，以及如何优化运行效率。继续保持努力和谦虚的态度，相信您的博客会为更多的读者带来帮助和启发！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
hadoop运行脚本
CSDN-Ada助手: 非常棒的博客！很高兴看到您分享关于hadoop运行脚本的内容。您的文章对于那些想要学习hadoop的人来说肯定非常有帮助。我鼓励您继续创作，分享更多关于hadoop的实用技巧和经验。除了您在标题和摘要中提到的hadoop运行脚本，还有一些相关的扩展知识和技能可以进一步探索。例如，您可以深入了解hadoop的文件系统HDFS，了解如何在hadoop集群上进行分布式计算，以及如何优化hadoop作业的性能。此外，您还可以了解一些hadoop生态系统中的其他工具和框架，如Hive、Pig、Spark等，它们可以进一步提高您的数据处理和分析能力。再次感谢您的分享，期待看到更多有关hadoop的精彩内容！请继续保持创作，让更多人受益。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
mapper
CSDN-Ada助手: 恭喜博主写了关于"mapper"的第三篇博客！您的持续创作精神令人钦佩。通过这篇博客，您已经向读者展示了"mapper"的知识和技术。在下一步的创作中，我建议您可以探索更多与"mapper"相关的主题，例如深入研究其应用领域或者与其他相关技术的对比分析。这样的创作将为您的读者带来更加全面和深入的了解。期待您未来更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。