(2)hadoop系列之hadoop本地模式部署

感谢朋友支持本博客,欢迎共同探讨交流,由于能力和时间有限,错误之处在所难免,欢迎指正!

如果转载,请保留作者信息。


hadoop系列之hadoop本地模式部署

Hadoop部署模式

Hadoop部署模式有:本地模式、伪分布模式、完全分布式模式

本地模式:默认情况下,Hadoop被配置为以非分布模式运行,作为单个Java进程。这对调试很有用,或者快速安装体验Hadoop

伪分布模式:Hadoop也可以在伪分布模式下的单节点上运行,其中每个Hadoop守护进程都在单独的Java进程中运行,学习Hadoop一般是在伪分布式模式下进行。这种模式是在一台机器上各个进程上运行Hadoop的各个模块,伪分布式的意思是虽然各个模块是在各个进程上分开运行的,但是只是运行在一个操作系统上的,并不是真正的分布式。

完全分布式模式:完全分布式模式才是生产环境采用的模式,Hadoop运行在服务器集群上,生产环境一般都会做HA,以实现高可用。

 

本文介绍hadoop的本地模式部署方法

本地模式是最简单的模式,所有模块都运行与一个JVM进程中,使用的本地文件系统,而不是HDFS,本地模式主要是用于本地开发过程中的运行调试用。下载hadoop安装包后,解压hadoop后就是直接可以使用,不用任何设置,默认的就是本地模式。

 

[root@hadoop softwares]# tar -zxvfhadoop-2.5.0-cdh5.3.6.tar.gz   -C/opt/modules/

[root@hadoop ~]# cd/opt/modules/hadoop-2.5.0-cdh5.3.6/

[root@hadoop hadoop-2.5.0-cdh5.3.6]# mkdirinput    创建本地存储目录

[root@hadoop hadoop-2.5.0-cdh5.3.6]# mkdir-p /opt/data/

[root@hadoop hadoop-2.5.0-cdh5.3.6]# touch/opt/data/data.input  创建测试文件

[root@hadoop hadoop-2.5.0-cdh5.3.6]# vi/opt/data/data.input   写入测试数据

hadoop mapreduce hive

hbase spark storm

sqoop hadoop hive

spark hadoop

运行MapReduce程序

[root@hadoop hadoop-2.5.0-cdh5.3.6]#bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0-cdh5.3.6.jarwordcount /opt/data/data.input output

 

注意:wordcount 统计数据的输出次数; /opt/data/data.input为准备的数据;  output为自动生成的输出目录,如果output目录存在,则运行程序为报错,如下所示:

18/03/1904:44:44WARNsecurity.UserGroupInformation:PriviledgedActionExceptionas:root (auth:SIMPLE)cause:org.apache.hadoop.mapred.FileAlreadyExistsException:Output directoryfile:/opt/modules/hadoop-2.5.0-cdh5.3.6/output already exists

org.apache.hadoop.mapred.FileAlreadyExistsException:Outputdirectoryfile:/opt/modules/hadoop-2.5.0-cdh5.3.6/output already exists

 

解决办法:删除output目录

rm -rf /opt/modules/hadoop-2.5.0-cdh5.3.6/output 

 

看到以下结果,说明hadoop本地模式运行成功:

 

查看输出文件,本地模式下,mapreduce的输出是输出到本地。

[root@hadoop hadoop-2.5.0-cdh5.3.6]# ls -l output/

total 4

-rw-r--r-- 1 root root 60 Mar 19 04:45 part-r-00000

-rw-r--r-- 1 root root  0Mar 19 04:45 _SUCCESS

[root@hadoop hadoop-2.5.0-cdh5.3.6]# cat output/part-r-00000

hadoop  3

hbase   1

hive    2

mapreduce   1

spark   2

sqoop   1

storm   1

 

[root@hadoop hadoop-2.5.0-cdh5.3.6]# cp etc/hadoop/*.xml  ./input

[root@hadoop hadoop-2.5.0-cdh5.3.6]#bin/hadoop jarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0-cdh5.3.6.jar  grep input output2  'dfs[a-z.]+'

过滤dfs开头的单词到putput2目录中


hadoop本地运行成功:

 

[root@hadoophadoop-2.5.0-cdh5.3.6]# ls -l output2/

total 4

-rw-r--r-- 1 rootroot 11 Mar 19 04:59 part-r-00000

-rw-r--r-- 1 rootroot  0 Mar 19 04:59 _SUCCESS

[root@hadoop hadoop-2.5.0-cdh5.3.6]#cat output2/part-r-00000

1    dfsadmin

输出目录中有_SUCCESS文件说明JOB运行成功,part-r-00000是输出结果文件


至此,hadoop本地模式部署演示完成。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

远虑近忧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值