hadoop总结-配置

分布式部署:

  1. 虚拟机,jdk

  2. hostname, hosts,关闭防火墙,selinux

永久修改主机名centos6      (/etc/sysconfig/network) 或者 centos7      (/etc/hostname)
关闭selinux        /etc/sysconfig/selinux (防火墙和selinux开启会使许多服务端口关闭,挺麻烦,关了吧)
  1. 安装hadoop,并配置

hadoop-env.sh
mapred-env.sh
yarn-env.sh 添加 jdk

export JAVA_HOME="/opt/jdk-11.0.1"
core-site.xmlnamenode,hadoop临时目录 和 checkpoint
hdfs-site.xml备份 和 secondnamenode
slavesdatanode那些节点
yarn-site.xmlresourcemanager 和日志聚集
mapred-site.xml历史服务器和制定yarn

官网很详细。

  1. ssh 免密 scp 分发到其他节点
    免密:
ssh-keygen -t rsa #生成公钥
ssh-copy-id 节点名 #分发公钥

分发:

Hadoop根目录下的share/doc目录是存放的hadoop的文档,文件相当大,建议在分发之前将这个目录删除掉,可以节省硬盘空间并能提高分发的速度。

scp -r /opt/hadoop/mztt1:/opt/
  1. 格式化namenode,启动
为什么格式化  : 每次格式化,默认是创建一个集群ID,并写入NameNode和DataNode的VERSION文件中(VERSION文件所在目录为dfs/name/current 和 dfs/data/current),重新格式化时,默认会生成一个新的集群ID,如果不删除原来的目录,会导致namenode中的VERSION文件中是新的集群ID,而DataNode中是旧的集群ID,不一致时会报错。
另一种方法是格式化时指定集群ID参数,指定为旧的集群ID。
start-all.sh  或者  start-dfs.sh + start-yarn.sh
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值