hadoop伪分布模式

4.2.1 启动HDFS并运行MapReduce程序4.2.2 YARN上运行MapReduce 程序4.2.3 配置历史服务器4.2.4 配置日志的聚集
摘要由CSDN通过智能技术生成

1.概要:

伪分布式就是在一台虚拟主机上同时开启以下所有进程
NameNode、DataNode、ResourceManager、NodeManager、JobHistoryServer

操作上

1、要在已经可以联网的虚拟机上安装好JDK+HADOOP,配置环境变量
2、配置相关文件
3、启动集群相关进程,并检查启动是否成功,尤其namenode格式化要注意删除data、logs文件夹
4、对hdfs文件增删改查操作,包括下载到本地Linux文件系统中。
5、在hadoop上运行任务,如hadoop自带的wordcount、grep示例
		bin/hadoop jar	share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar 	
		wordcount /user/atguigu/input/ /user/atguigu/output
6、在web端查看文件系统或者任务的日志信息

2.环境变量的配置

jdk:

文件:将jdk的压缩包(jdk-8u171-linux-x64.tar.gz)放在/opt/software里
解压:tar -zxvf jdk-8u171-linux-x64.tar.gz  -C /opt/module/	
		(解压到指定文件夹中,-C 不要漏)
pwd:进入/opt/module/jdk1.8.0_171,pwd复制jdk的根目录
vim /etc/profile编辑环境变量:
	export JAVA_HOME=/opt/module/jdk1.8.0_171
	export PATH=$PATH:$JAVA_HOME/bin
保存后将文件生效:source /etc/profile
测试环境变量:java -version
jdk环境变量配置成功

hadoop:

源文件:将hadoop的压缩包(hadoop-2.7.2.tar.gz)放在/opt/software里
解压:tar -zxvf hadoop-2.7.2.tar.gz  -C  /opt/module/
					(解压到指定文件夹中,-C 不要漏)
pwd:进入/opt/module/hadoop-2.7.2,pwd复制hadoop的根目录
vim /etc/profile编辑环境变量:
	export HADOOP_HOME=/opt/module/hadoop-2.7.2
	export PATH=$PATH:$HADOOP_HOME/bin
	export PATH=$PATH:$HADOOP_HOME/sbin
保存后将文件生效:source /etc/profile
测试环境变量:hadoop version
hadoop环境变量配置成功

3.hadoop运行模式

本地模式:local,配置文件不需要改动
伪分布模式:只有一个节点,所有的hdfs+mapreduce+yarn在一台主机上
完全分布式:三台虚拟机模拟的hadoop集群,hdfs+mapreduce+yarn

4.hadoop文件系统

bin:hadoop+hd
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值