具体问题
JAR does not exist or is not a normal file: /export/servers/hadoop-3.3.0/share/hadoop/mapreduce/hadoop-streaming.jar——找不到streaming.jar
推测解决方案
搜索得出结论不论是Hadoop3还是Hadoop2都存在hadoop-streaming.jar。故推断Hadoop3的streaming.jar只是位置和Hadoop2不同。
解决
于是翻找安装目录下的每个文件夹,查看share/hadoop下的所有目录中的子目录和文件,发现tools目录下没有编译好的jar包,但发现了有source子目录,在source下发现hadoop-streaming-3.3.0-sources.jar,于是在lib目录下发现编译好的hadoop-streaming-3.3.0.jar。
故使用hadoop-streaming-3.3.0.jar尝试词频分析:
hadoop jar hadoop-streaming-3.3.0.jar \
-input /被分析的词频文件路径 \
-output /分析结果输出路径 \
-mapper "python /map的python脚本路径" \
-reducer "python /reduce的python脚本路径" \