hadoop streaming

最新推荐文章于 2019-08-29 11:42:38 发布

andrewgyq

最新推荐文章于 2019-08-29 11:42:38 发布

阅读量339

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/guyuqinggu/article/details/40047863

版权

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

hadoop streaming支持其它编程语言来写map、reduce程序，下面以python为例子。

1.编写mapper.py

#!/usr/bin/env python

import sys

for line in sys.stdin:
    for word in line.split():
        print '%s\t%s' % (word, 1)

2.测试mapper.py

cat file | python mapper.py

3.编写reducer.py

#!/usr/bin/env python

import sys

cur_key = None
cur_count = 0

for line in sys.stdin:
    key, value = line.split()
    if key == cur_key:
        cur_count += int(value)
    else:
        if cur_key:
            print '%s\t%s' % (cur_key, cur_count)
        cur_key = key
        cur_count = int(value)

print '%s\t%s' % (cur_key, cur_count)

4.提交作业

hadoop jar mydir/hadoop-1.2.1/contrib/streaming/hadoop-streaming-1.2.1.jar -mapper mapper.py -reducer reducer.py -file mapper.py -file reducer.py -input largedata -output output

5.查看结果

hadoop dfs -cat output/part-00000 | head -n 5

参考：

https://www.youtube.com/watch?v=6WuMqcUtCWw

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

andrewgyq

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop streaming

hadoop streaming支持其它编程语言来写map、reduce程序
复制链接

扫一扫

专栏目录

Hadoop——Hadoop Streaming——学习笔记

phacpf123

05-15

318

Hadoop流-Streaming Hadoop流提供了一个API，允许用户使用任何脚本语言写Map函数或Reduce函数使用UNIX标准流作为程序与Hadoop之间的接口 #例子#

Hadoop Streaming

囡囡的博客

03-24

127

Hadoop Streaming 使用及参数设置 https://www.cnblogs.com/hopelee/p/7476145.html

参与评论您还未登录，请先登录后发表或查看评论

使用Hadoop Streaming

Daniel 的技术笔记不积跬步无以至千里，不积小流无以成江海。

08-02

3696

hadoop大家都了解的，不再细说。之前用java写过MR程序，对Hadoop streaming了解不多，Hadoop streaming是和Hadoop一起发布的实用程序，它允许用户创建和执行使用任何程序或者脚本编写的map或者reduce的mapreducejobs，实际工作中看到不少同学用python、shell、Perl等编写Hadoop streaming程序(开发效率确实高)。在运行

Hadoop Streaming详解

choubaichuang8869的博客

06-19

149

https://www.cnblogs.com/shay-zhangjin/p/7714868.html 转载于:https://my.oschina.net/u/724369/blog/...

hadoop streaming 使用总结

coder_oyang的博客

11-08

820

hadoop client：客户端可以让用户访问集群，hadoop client 使用手册，通过配置hadoop-site.xml文件，实现访问不同集群，同时该客户端目录的 xx/xx/hadoop/bin/hadoop 是你配置的hadoop命令路径，在streaming命令参数配置时，需要指明该hadoop位置，对于该命令，可以通过alias hadoopdr='xx/xx/hadoop/...

Hadoop - Hadoop Streaming

06-21

1 Hadoop Streaming3 2 How Streaming Works 3 3 Streaming Command Options4 3.1 Specifying a Java Class as the Mapper/Reducer 5 3.2 Packaging Files With Job Submissions 5 3.3 Specifying Other Plugins ...

Hadoop streaming详细介绍

01-10

Hadoop streaming Hadoop为MapReduce提供了不同的API，可以方便我们使用不同的编程语言来使用MapReduce框架，而不是只局限于Java。这里要介绍的就是Hadoop streaming API。Hadoop streaming 使用Unix的standard ...

Hadoop Streaming 编程

04-25

在分布式计算领域，Hadoop Streaming 是一个至关重要的工具，它使得开发者可以利用任何可执行文件或脚本（如 Java、Python、Shell 等）来编写 MapReduce 作业，而无需直接使用 Java API。Hadoop Streaming 的核心...

( Hadoop Streaming编程实战（C++、PHP、Python）.pdf )

04-15

( Hadoop Streaming编程实战（C++、PHP、Python）.pdf ) ( Hadoop Streaming编程实战（C++、PHP、Python）.pdf )

hadoop streaming 常用参数以及动态调整

理想不再遥不可及

08-29

742

常用参数多路输出： hadoop streaming 支持多路输出，每个reducer可以将数据输出到part-xxxxx-[A-Z] 为了多路输出，需要： 1.设定hadoop参数： -outputformat org.apache.hadoop.mapred.lib.SuffixMultipleSequenceFileOutputFormat 2.输出的数据需要在最后加上#[A-Z] 比如...

Hadoop streaming详解

热门推荐

点火三周的专栏

03-14

1万+

Hadoop streamingHadoop为MapReduce提供了不同的API，可以方便我们使用不同的编程语言来使用MapReduce框架，而不是只局限于Java。这里要介绍的就是Hadoop streaming API。Hadoop streaming 使用Unix的standard streams作为我们mapreduce程序和MapReduce框架之间的接口。所以你可以用任何语言来编写MR

hadoop streaming 遇到的问题小结

danlei94的博客

10-25

1528

Hadoop Streaming 非常友好的一点是可以map 和reduce可以用python或者shell来写。狼厂的大boss在安装Hadoop的时候就说道一定要安装Hadoop streaming！于是开启了我Hadoop streaming 新世界的大门。

Hadoop Streaming的使用

小屋

08-26

1265

资料来源：https://zhuanlan.zhihu.com/p/34903460 重点记录： mapper的角色:hadoop将用户提交的mapper可执行程序或脚本作为一个单独的进程加载起来，这个进程我们称之为mapper进程，hadoop不断地将文件片段转换为行，传递到我们的mapper进程中，mapper进程通过标准输入的方式一行一行地获取这些数据，然后设法将其转换为键值对，再通过标...

Hadoop Streaming原理及实践

鸟哥哥的专栏

09-24

1162

Hadoop Streaming原理及实践

2024年东南亚二硫代氨基甲酸酯类杀菌剂市场深度研究及预测报告.pdf

07-08

东南亚位于我国倡导推进的“一带一路”海陆交汇地带，作为当今全球发展最为迅速的地区之一，近年来区域内生产总值实现了显著且稳定的增长。根据东盟主要经济体公布的最新数据，印度尼西亚2023年国内生产总值（GDP）增长5.05%；越南2023年经济增长5.05%；马来西亚2023年经济增速为3.7%；泰国2023年经济增长1.9%；新加坡2023年经济增长1.1%；柬埔寨2023年经济增速预计为5.6%。东盟国家在“一带一路”沿线国家中的总体GDP经济规模、贸易总额与国外直接投资均为最大，因此有着举足轻重的地位和作用。当前，东盟与中国已互相成为双方最大的交易伙伴。中国-东盟贸易总额已从2013年的443亿元增长至 2023年合计超逾6.4万亿元，占中国外贸总值的15.4％。在过去20余年中，东盟国家不断在全球多变的格局里面临挑战并寻求机遇。2023东盟国家主要经济体受到国内消费、国外投资、货币政策、旅游业复苏、和大宗商品出口价企稳等方面的提振，经济显现出稳步增长态势和强韧性的潜能。本调研报告旨在深度挖掘东南亚市场的增长潜力与发展机会，分析东南亚市场竞争态势、销售模式、客户偏好、整体市场营商环境，为国内企业出海开展业务提供客观参考意见。本文核心内容：市场空间：全球行业市场空间、东南亚市场发展空间。竞争态势：全球份额，东南亚市场企业份额。销售模式：东南亚市场销售模式、本地代理商客户情况：东南亚本地客户及偏好分析营商环境：东南亚营商环境分析本文纳入的企业包括国外及印尼本土企业，以及相关上下游企业等，部分名单 QYResearch是全球知名的大型咨询公司，行业涵盖各高科技行业产业链细分市场，横跨如半导体产业链（半导体设备及零部件、半导体材料、集成电路、制造、封测、分立器件、传感器、光电器件）、光伏产业链（设备、硅料/硅片、电池片、组件、辅料支架、逆变器、电站终端）、新能源汽车产业链（动力电池及材料、电驱电控、汽车半导体/电子、整车、充电桩）、通信产业链（通信系统设备、终端设备、电子元器件、射频前端、光模块、4G/5G/6G、宽带、IoT、数字经济、AI）、先进材料产业链（金属材料、高分子材料、陶瓷材料、纳米材料等）、机械制造产业链（数控机床、工程机械、电气机械、3C自动化、工业机器人、激光、工控、无人机）、食品药品、医疗器械、农业等。邮箱：market@qyresearch.com

04N50C3-VB TO252一款N-Channel沟道TO252的MOSFET晶体管参数介绍与应用说明

07-08

04N50C3-VB TO252；Package：TO252；Configuration：Single-N-Channel；VDS：650V；VGS：30（±V）；Vth：3.5V；RDS(ON)=1000mΩ@VGS=10V；ID：5A；Technology：SJ_Multi-EPI；

07-08

07-08

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交