Hadoop分布式集群搭建过程问题总结

1、使用ll命令和chown命令对zookeeper文件的拥有者进行修改后,在普通用户hadoop下启动zookeeper,但是报一下错误:

 

 

[hadoop@Slave1 zookeeper]$ bin/zkServer.sh start

JMX enabled by default

Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg

Starting zookeeper ... bin/zkServer.sh: line 113: /usr/local/zookeeper/zkdata/zookeeper_server.pid: Permission denied

FAILED TO WRITE PID

[hadoop@Slave1 zookeeper]$


主要错误点是:Permission denied FAILED TO WRITE PID,字面意思是没有写权限。

接下来,使用chmod命令增加权限,再次启动,成功:

 

 

[hadoop@Slave1 local]$ su

Password:

[root@Slave1 local]# chmod a+xwr zookeeper/

[root@Slave1 local]# exit

exit

[hadoop@Slave1 local]$ cd zookeeper/

[hadoop@Slave1 zookeeper]$ bin/zkServer.sh start

JMX enabled by default

Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg

Starting zookeeper ... STARTED

2、节点规划时 journalnode和zookeeper要保持奇数个,namenode2个,resourcemanager2个。

3、deploy.sh的脚本工具是用来统一将下载配置好的软件分发到各个节点上,runRemoteCmd是用来同时启动各节点的。

4、

  1. runRemoteCmd.sh "/home/hadoop/app/zookeeper/bin/zkServer.sh start" zookeeper

 

[hadoop@djt11 hadoop]$ sbin/start-dfs.sh

[hadoop@djt11 hadoop]$ sbin/yarn-daemon.sh start resourcemanager

5、集群的数量由哪些决定?

1)数据量:是一定时期内的数据,要有一个预测,而不是现在的数据。

                       副本的个数

                       除了实际数据之外,要考虑日志数据 临时数据(20-30%),还有处理的空间(20-30%)

2)每台机器的性能:处理的速度

3)非功能需求:数据的排序,数据的导入,数据清洗时间。可靠性,容错性

6、pid一般是放在临时目录里的,我们可以配置放在一个目录里面,防止非正常关机无法正常关闭开启集群。

7、第一步时间同步操作完,但是第一天没搭建完,第二天再启动机器,发现时间不一致了。为什么?

      可以用service ntpt status 看一下,如果没有启动,则service ntpt start   再ntpdate pool.ntp.org

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值