hadoop修改配置文件和环境变量_hadoop命令环境变量export配置

fs.defaultFS hdfs://node1:8020 hadoop.tmp.dir /export/data/hadoop-3.3.0 hadoop.http.staticuser.user root hadoop.proxyuser.root.hosts * hadoop.proxyuser.root.groups * fs.trash.interval 1440

### 3、hdfs-site.xml


作用:指定SNN进程的位置信息 和 每个block的备份数量



vi hdfs-site.xml


#在configuration标签内添加内容



dfs.namenode.secondary.http-address node2:9868

补充:这里指定secondarynamenode在node2上,也就意味着我们jps时,这个进程是显示在node2节点上,而不是node1,如果想要放在node1上,只需修改value的值即可。


### 4、mapred-site.xml


作用:mapreduce相关的  
 注意:有些版本是没有mapred-site.xml文件的,只有mapred-site.xml.template模板,可以先复制一份这样的模板,再去修改。  
 1)备份mapred-site.xml.template



cp mapred-site.xml.template mapred-site.xml


如果有mapred-site.xml,忽略这一步。


2)修改文件



vi mapred-site.xml



mapreduce.framework.name yarn mapreduce.jobhistory.address node1:10020 mapreduce.jobhistory.webapp.address node1:19888 yarn.app.mapreduce.am.env HADOOP_MAPRED_HOME=${HADOOP\_HOME} mapreduce.map.env HADOOP_MAPRED_HOME=${HADOOP\_HOME} mapreduce.reduce.env HADOOP_MAPRED_HOME=${HADOOP\_HOME}

### 5、yarn-site.xml


作用:与yarn相关的,指定resourcemanager的位置信息。



vi yarn-site.xml


#在configuration标签内添加内容



yarn.resourcemanager.hostname node1 yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.pmem-check-enabled false yarn.nodemanager.vmem-check-enabled false yarn.log-aggregation-enable true yarn.log.server.url http://node1:19888/jobhistory/logs yarn.log-aggregation.retain-seconds 604800

### 6、workers


作用:指定工作的节点有哪些。  
 注意:在hadoop3.0以前,这个文件叫slaves,3.0之后叫做workers。由于我这里是hadoop3.3.0,所以



vi workers


把文件里面的localhost删除,添加以下内容



node1
node2
node3


**补充**: /etc/hosts 和 workers 这两个文件里的主机名写法应该保持一致,否则会导致启动集群时,系统无法识别主机名。比如我/etc/hosts 里写的是node1,那 workers 里写的也应该是node1,而不是node1.itcast.cn。


**至此,配置文件修改完成。**


## 三、分发同步hadoop


先前并没有同步hadoop服务,是因为想等修改好配置文件后,再把整个hadoop目录同步过去。  
 1)回到服务安装路径下,也就是我这里的`/export/servers`。



cd /export/servers


2)执行以下命令



scp -r hadoop-3.3.0 root@node2: P W D s c p − r h a d o o p − 3.3.0 r o o t @ n o d e 3 : PWD scp -r hadoop-3.3.0 root@node3: PWDscprhadoop3.3.0root@node3:PWD


补充:**$PWD表示当前节点所在的绝对路径**,在这里就是`/export/servers`,  
 在执行上述命令后,会把node1当前路径下的hadoop-3.3.0目录及其子目录、文件 复制到 node2和node3 的相同路径(/export/servers)下。也就是root@node2:/export/servers 的另一种写法。


至此,所有节点都安装了hadoop。


## 四、配置环境变量


光是下载好jdk和hadoop是不行的,系统不知道它们的路径,也就无法正常使用它们。就像我们在命令符界面使用某些工具时,都需要去到相应的路径才能正常使用一样。  
 负责环境变量的文件是`/etc/profile`。


### 1、修改环境变量



vi /etc/profile


将下面内容添加到profile文件中,然后保存退出。



#java path
export JAVA_HOME=/export/servers/jdk1.8.0_241
export PATH= P A T H : PATH: PATH:JAVA_HOME/bin
export CLASSPATH=.: J A V A _ H O M E / l i b / d t . j a r : JAVA\_HOME/lib/dt.jar: JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar
#hadoop path
export HADOOP_HOME=/export/servers/hadoop-3.3.0
export PATH= P A T H : PATH: PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin


补充:一定要以自己的jdk和hadoop安装路径为准


### 2、分发环境变量文件


将修改好的profile分件分发给其它节点,就无需每个都配置一次。



scp /etc/profile root@node2:/etc/
scp /etc/profile root@node3:/etc/



**自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。**

**深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!**

**因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。**
![img](https://img-blog.csdnimg.cn/img_convert/fdd6c139c2db34d6c628bb549ba8b3f5.png)
![img](https://img-blog.csdnimg.cn/img_convert/ec37f5c11bdff83d08394361d1c010ec.png)
![img](https://img-blog.csdnimg.cn/img_convert/9d5f43968834e33666d8dc7e8a60efb6.png)
![img](https://img-blog.csdnimg.cn/img_convert/53a6c3945bcc101d4ecbe63d4a06231c.png)
![img](https://img-blog.csdnimg.cn/img_convert/9087768bb202cebcb66e7265cf630ca3.png)

**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**

**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
![img](https://img-blog.csdnimg.cn/img_convert/e92293d0a525b9878e7b975757a36cc8.png)

(img-UTJJh79A-1712838586326)]
[外链图片转存中...(img-qwsQjVAC-1712838586326)]

**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**

**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**

**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
[外链图片转存中...(img-rNJp0DqY-1712838586327)]

  • 24
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop环境中,`HADOOP_CONF_DIR`是一个重要的系统变量,用于指定Hadoop配置文件所在的目录。为了确保Hadoop能够正确找到和使用配置文件,你需要按照以下步骤检查和设置这个变量: 1. **检查当前值**: 打开终端或命令提示符,输入以下命令来查看`HADOOP_CONF_DIR`的当前值: ``` echo $HADOOP_CONF_DIR ``` 如果该变量尚未被设置,输出将会是空的。 2. **设置环境变量**: - **Linux/Unix**: 在终端中,你可以使用`export`命令永久设置环境变量,例如: ```sh export HADOOP_CONF_DIR=/path/to/hadoop/conf ``` 这里 `/path/to/hadoop/conf` 应替换为实际的Hadoop配置文件目录。设置后,新的值将立即生效,并且将在新的shell会话中保持。 - **Windows**: 右键点击“此电脑”或“计算机”,选择“属性”,然后转到“高级系统设置”>“环境变量”>在系统变量部分找到“Path”,添加或编辑`HADOOP_CONF_DIR`,并在变量值后面加上`;`和配置目录路径。 3. **验证设置**: 设置后,再次运行`echo %HADOOP_CONF_DIR%`(Windows)或`echo $HADOOP_CONF_DIR`(Linux/Unix),确认新的路径是否正确显示。 4. **启动服务或应用**: 重新启动Hadoop服务(如HDFS和YARN)或者运行Hadoop命令(如`hadoop fs`或`hadoop jar`)以应用新设置。 如果你需要在所有用户的系统上设置这个环境变量,可能需要添加到系统初始化脚本(如`.bashrc`或`profile`文件)中,以便在登录时自动加载。 相关问题: 1. `HADOOP_CONF_DIR`变量在Hadoop中的作用是什么? 2. 如何在Hadoop集群管理工具中设置环境变量? 3. 如果已经设置了`HADOOP_CONF_DIR`,但服务仍然找不到配置文件,应如何排查?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值