Hadoop错误2_Hadoop伪分布式下，运行WordCount时，Input path does not exist错误原因

最新推荐文章于 2023-06-03 12:16:17 发布

爱萨萨

最新推荐文章于 2023-06-03 12:16:17 发布

阅读量1.9k

点赞数

分类专栏：技术-大数据文章标签： hadoop 伪分布式错误

技术-大数据专栏收录该内容

205 篇文章 19 订阅

订阅专栏

在伪分布式下，按照下面两个博客，分别以命令行方式和Eclipse执行WordCount程序时，都会出现同样的错误，

（Eclipse：http://blog.csdn.net/wang_zhenwei/article/details/47422775）

（命令行方式：http://blog.csdn.net/wang_zhenwei/article/details/47439623）

错误描述为：

Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:9000/user/hadoop/input

即在路径hdfs://localhost:9000/user/hadoop/input下，找不到input文件，

回顾最开始时，Hadoop伪分布式环境的安装教程，里面有对hdfs://localhost:9000/的相关操作，

（伪分布式配置：http://blog.csdn.net/wang_zhenwei/article/details/47043603）

这是伪分布式环境配置时的相关操作，

操作一：

修改配置文件 core-site.xml 为如下所示(vim /usr/local/hadoop/etc/hadoop/core-site.xml)：

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

原文件中的内容为 (vim /usr/local/hadoop/etc/hadoop/core-site.xml)：

<configuration>

</configuration>

分析说明一：

如果将core-site.xml文件变动为原来的内容，则程序将不再去hdfs://localhost:9000下寻找input文件，而是在当前目录下寻找input文件，程序能够正常运行。

操作二：

上面的单机模式，grep 例子读取的是本地数据，伪分布式读取的则是 HDFS 上的数据。要使用 HDFS，首先需要创建用户目录

bin/hdfs dfs -mkdir -p /user/hadoop

接着将 etc/hadoop 中的文件作为输入文件复制到分布式文件系统中，即将 /usr/local/hadoop/etc/hadoop 复制到分布式文件系统中的 /user/hadoop/input 中。上一步已创建了用户目录 /user/hadoop ，因此命令中就可以使用相对目录如 input，其对应的绝对路径就是 /user/hadoop/input: