Hadoop学习笔记-4

  1. 元数据持久化
    原理如下:



    只有NameNode节点存在edits_xxx和fsimage_xxx,而DataNode节点是blk_xxx和blk_xxx.meta。DataNode节点会将Block List发给NameNode进行记录,并形成索引。

  2. 本地多目录
    多个目录之间使用逗号分隔

  • dfs.namenode.name.dir
    NameNode配置多个本地目录主要是为了可靠性;
    每个目录存放的内容相同;
  • dfs.datanonde.data.dir
    可以给不同的节点配置不同的数据存放目录;
    同一节点的不同的数据存放目录存放的数据内容不同——各目录之间不是备份的关系;
    数据节点配置多个目录不是为了可靠性;
    每个目录存放的数据内容不同;
  1. 常用端口
  • NameNode
    RPC:8020
    WebUI:50070
  • DataNode
    RPC:8032
    WebUI:50075
  • SecondaryNameNode
    WebUI:50090
  • HistoryServer
    WebUI:19888
  • ResourceManager
    WebUI:8088
  • NodeManager
    WebUI:8042
  1. 服役和退役
  • slaves配置了DataNode的节点集(一个节点主机一行)。作用只在集群启动时启动全量的集群节点。
  • dfs.hosts
    决定是否可以连接NameNode
  • dfs.hosts.exclude
    决定不能连接NameNode
1) 创建/soft/hadoop/etc/dfs-hosts-include.conf文件
	s200
	s300
2) 创建/soft/hadoop/etc/dfs-hosts-exclude.conf文件
	s300
	s400
3) 编辑配置文件hdfs-site.xml
dfs.hosts=/soft/hadoop/etc/dfs-hosts-include.conf
dfs.hosts.exclude=/soft/hadoop/etc/dfs-hosts-exclude.conf
4) 分发hdfs-site.xml文件到所有节点
5) 刷新节点
hdfs dfsadmin -refreshNodes
hdfs dfsadmin -help refreshNodes
  1. Version
  • clusterID = xxx(NameNode == DataNode)
  • storageID = xxx(DataNode)
  • storageType = 角色(NameNode或者DataNode)
  • cTime 集群创建时间
  • ACL 权限控制
  1. 安全模式
  • NameNode启动时,合并fsimage和edit形成新的fsimage,并产生新的edit log。
  • 安全模式下客户端只能读取。
  • 查看NameNode是否位于安全模式:
hdfs dfsadmin -safemode get  # 查看
hdfs dfsadmin -safemode enter  # 进入
hdfs dfsadmin -safemode leave  #离开
  • 手动保存镜像文件(当前最新镜像)
hdfs dfsadmin -fetchImage /path/dir
  • 保存元数据到$HADOOP_HOME/logs/
hdfs dfsadmin -metasave data_xxx.meta
  • 启动均衡器
    让集群在数据存储上更为平均。
start-balance.sh
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值