Hadoop Streaming 获取mapreduce_map_input_file遇到的版本问题

最新推荐文章于 2021-06-18 10:56:29 发布

CatcherTheRye

最新推荐文章于 2021-06-18 10:56:29 发布

阅读量4k

点赞数 1

分类专栏： Hadoop 文章标签： Hadoop Streaming 环境变量 mapreduce_map_input_ map_input_file

本文链接：https://blog.csdn.net/catchertherye/article/details/44410645

版权

1 篇文章 0 订阅

订阅专栏

1.Hadoop Streaming，可以在任务中获取hadoop设置的环境变量，

例如用awk写的map可以这样获取：filename = ENVIRON["mapreduce_map_input_file"]

2.可是在不同的Hadoop集群提交作业的时候却遇到了版本的问题，

在0.21.0中，使用mapreduce_map_input_file可以取到作业输入文件名

在1.0.3中，必须使用map_input_file才可以取到作业输入文件名

3.查询网络资源，说是hadoop新旧api的问题，

即新api使用mapreduce_map_input_file这个环境变量能够获取

旧的api必须使用map_input_file才能获取

4.hadoop分支：

hadoop 0.21.0与1.0.3不属于一个分支，1.0.3是从0.20.1分支中发展而来的，

需要进一步验证，可以阅读下： hadoop-0.21.0-streaming.jar 与 hadoop-streaming-1.0.3.jar能够看出其中的端倪

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注