Hadoop本地运行

 

众所周知,Hadoop有三种运行模式:本地模式,伪分布模式,完全分布模式。挺多教程一上来就给伪分布模式的搭建过程,配置了许多 xml 配置文件,然后自己开始做实验的时候发现各种 FileNotExisted 错误,emmmm,所以还是从大家都推荐的本地模式开始测试,所谓万丈高楼平地起嘛~

其实本地模式非常简单,为了泛化所有的环境测试,让所有小伙伴都能够正确的进行测试,这里安装新的 Hadoop 开始:

1. 首先,从官网下载我们所需的版本(链接在这里),随便下载一个就行了~(不过尽量找比当前时间晚几个月的版本,在windows下有要求!)

 这里我使用2.9.1版本,下载完了解压就行了

2. 其次设置一下java路径,因为如果跟我一样默认安装在 Program Files ,中间的一个空格 Hadoop 无法正确解析,需要使用 Windows 自带的短名字(即 `Program Files` 变成 `PROGRA~1` ),设置如下(在第25行):

 这个根据各位的 Java 路径进行更改。

3. 如果是 Windows 的朋友,需要设置一下这一步——安装 winutils ,网址如下:winutils,这里使用 gitee 上别人从 github 扒来的代码,如果 github 能快速访问的朋友在 github 自行搜索 winutils 即可,然后找和自己版本对应的下载~

 这里我下载 2.9.1 版本,下载完了直接把所有的文件复制到 Hadoop 的 bin 目录,然后直接覆盖原文件即可。

4. 因为本地模式不需要任何的 守护进程 就可以启动,所以直接启动即可。进入 Hadoop 的 bin 目录,先创建一个 input 文件夹,然后输入如下经典测试命令(注意当前目录不能有 output ,如果有就直接删除,否则会报错):

.\hadoop jar ..\share\hadoop\mapreduce\hadoop-mapreduce-examples-2.9.1.jar grep input output 'dfs[a-z.]+'

然后按理就会看到如下界面:

 这里仅复制最后几行,如果出现如上界面就表明成功运行了,但是如果出现如下界面:

 就说明运行错误,找到上面的第一行,可以发现 FileAlreadyExistsException,就说明 output 已经存在,删除即可,如果有其他问题,找到错误源去网上搜索即可~

最后进入 output 目录,找到 part-r-00000 文件,用记事本打开就能够看到只有一行,即是正确结果。

5. 怎么能不给经典的 wordcount 一个表现的机会:

.\hadoop jar ..\share\hadoop\mapreduce\hadoop-mapreduce-examples-2.9.1.jar wordcount .\input\ output

这里 input 是一个文件夹,里面随便塞几个文件就行了。运行上述代码就能得到正确的结果(理论上如此 o(* ̄▽ ̄*)ブ)。

 如上图所示,打开 part-r-00000 得到如下结果(这里只截取一部分):

 

至此,基本的本地运行模式就测试完了,感谢阅读!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Windows系统上使用Hadoop本地运行与使用winutils有关。winutils是一个用于在Windows操作系统上模拟Unix风格文件系统权限的工具,Hadoop使用winutils来执一些文件系统操作,例如创建临时文件夹等。在Hadoop 3.1.1版本之前,需要手动下载和配置winutils才能在本地运行Hadoop。 以下是在Windows上配置Hadoop 3.1.1本地运行所需的步骤: 1. 下载winutils二进制文件:从Hadoop官方网站下载与Hadoop对应的winutils版本。注意要选择正确的版本,即与Hadoop 3.1.1版本兼容的winutils版本。 2. 创建Hadoop的安装目录:在本地电脑上选择一个文件夹,例如C:\hadoop,用于放置Hadoop的安装文件。 3. 解压和配置winutils:将下载的winutils压缩文件解压到刚刚创建的Hadoop安装目录(C:\hadoop)。解压后,应该在C:\hadoop目录下看到一个称为bin的文件夹,其中包含winutils.exe等文件。 4. 设置HADOOP_HOME环境变量:打开系统环境变量设置页面,在用户变量或系统变量中添加一个新的环境变量HADOOP_HOME,并将其值设置为Hadoop的安装目录(C:\hadoop)。 5. 配置PATH环境变量:在系统环境变量的Path变量中添加%HADOOP_HOME%\bin;这样,系统将能够在任何地方都找到winutils可执文件。 6. 验证配置:打开命令提示符(CMD)窗口,并运行以下命令:winutils.exe chmod 777 /temp。如果不出现任何错误提示,说明已成功配置winutils,可以在本地运行Hadoop。 通过以上步骤,你已经成功配置了Hadoop 3.1.1本地运行所需的winutils。现在你可以在Windows上使用Hadoop并执Hadoop相关操作了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值