Hadoop中namenode/secondarynamenode/yarn的一些配置

Hadoop在进行namenode -format的前(伪分布)一般会选择默认的配置,除了指定备份和tmp目录。

还有一些其他的配置在真正集群的时候也是一定要进行配置的。

简单记录一下hadoop的主要配置文件中core-site.xml  / hdfs-site.xml /mapred-site.xml/ yarn-site.xml的配置。

一、core-site.xml

真实环境是需要指定域名而不能是localhost

conf-1

二、hdfs-site.xml

dfs.replication 是备份块数,这台机器我是伪分布安装的,就给了1块

permissions是权限检查,应该true

namenode.http-address  :  namenode的web地址

namenode.secondary.httpaddress  :  secondary namenode 的web地址

namenode.name.dir :  指定namenode的数据存储的本地目录,默认是在tmp下的一个文件夹,单独拿出来

namenode.name.edits : 同样的道理

checkpoint就是secondary namenode的数据存储本地目录和日志目录。

conf-2

三、yarn-site.xml

配置resourcemanager的hostname

配置jobhistory的address

配置webapp的address

conf-3

四、slaves

将slaves中的主机名改成 hadoop-yarn.ptbird.cn 而不是localhost,因为上面配置都是使用的这个地址。

五、注意的问题

如果已经format,重新配置后为了省去麻烦,再次format的时候,最好删除掉之前/data/dfs/的内容,否则即使format成功了,很多服务也起不来。

最常见的问题是datanode起不来,因为clusterId已经记录过了,再次format会产生新的clusterId。

最好的做法是:

删除/data/dfs/*后,重启,然后再次format。

Hadoop的ResourceManager、NameNodeSecondaryNameNode都是大数据处理框架Hadoop的重要组件,它们各自承担着不同的职责。 1. ResourceManager ResourceManager是Hadoop YARN(Yet Another Resource Negotiator)的核心组件之一,它主要负责集群资源管理和任务调度。ResourceManager负责接收客户端提交的应用程序,并将其分配给可用的NodeManager节点执行。同时,ResourceManager还负责监控集群资源的使用情况,以便更好地调度任务。 2. NameNode NameNodeHadoop HDFSHadoop Distributed File System)的核心组件之一,它主要负责管理和存储HDFS的文件元数据。NameNode负责维护文件系统的目录树、文件和目录的访问权限、文件块的位置信息等。所有的文件操作都需要先向NameNode发起请求,以便获取文件元数据信息。 3. SecondaryNameNode SecondaryNameNodeHadoop HDFS的辅助组件,它主要负责协助NameNode完成元数据的备份和合并工作。由于NameNode负责管理HDFS的所有文件元数据,因此SecondaryNameNode的作用就是定期地从NameNode获取元数据备份,并将其合并为一个新的镜像文件,以便在NameNode发生故障时进行恢复。 相同点:ResourceManager、NameNodeSecondaryNameNode都是Hadoop的重要组件,都是用来管理和协调Hadoop集群的资源和任务。 区别:ResourceManager主要负责集群资源管理和任务调度,NameNode主要负责管理HDFS的文件元数据,而SecondaryNameNode则是协助NameNode完成元数据备份和合并工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值