大数据企业学习篇02_3-------hadoop高级

一.搭建分布式集群应该注意的问题

<1>集群搭建完成以后,需要进行基准测试,是为了测试集群的性能。
监控集群企业主要用Cloudera,Cloudera Manager
* 部署安装集群
* 监控集群
* 配置同步集群
* 预警。。。。。

<2>Centos复制克隆虚拟机,虚拟网卡变成了eth1,如何解决?
*切换root
*vi /etc/udev/rules.d/70-persistent-ipoib.rules
*vi /etc/sysconfig/network-scripts/ifcfg-eth0
*重启机器即可恢复
<3>集群时间同步
* 找一台机器
时间服务器
* 所有的机器与这台机器时间进行定时的同步
比如,每日十分钟,同步一次时间

1.rpm -qa|grep ntp   
2.vi /etc/ntp.conf 
  注释掉以下内容
#server 0.centos.pool.ntp.org
#server 1.centos.pool.ntp.org
#server 2.centos.pool.ntp.org
                #server 3.centos.pool.ntp.org iburst
把以下内容注释去掉,如果内容不存在 手动添加
server  127.127.1.0     # local clock
fudge   127.127.1.0 stratum 10
去掉以下内容的#  192.168.30.0 修改自己的网段
restrict 192.168.30.0 mask 255.255.255.0 nomodify notrap
保存退出
3.vi /etc/sysconfig/ntpd
# Drop root to id 'ntp:ntp' by default.
    SYNC_HWCLOCK=yes
    OPTIONS="-u ntp:ntp -p /var/run/ntpd.pid -g"
4.service ntpd status
5.service ntpd start
6.chkconfig ntpd on
操作centos002.hadoop centos003.hadoop
去同步第一台centos001.hadoop这台服务器的时间
[root@centos002 ~]# service ntpd stop
 # chkconfig ntpd off
二三台服务器去同步第一台服务器时间:
# ntpdate centos001.hadoop
制定计划任务 周期性同步时间 二三台服务器
# crontab -e
*/10 * * * * /usr/sbin/ntpdate centos001
分 时 日 月 星期
重启 :
# service crond restart

详情见

> http://blog.csdn.net/slibra_l/article/details/77716081

二、分布式协作框架Zookeeper

<1> *同步服务
*命名空间结构与文件系统类似
*基于观察者模式设计
<2>Zookeeper角色
这里写图片描述
<3>Zookeeper配置参数详解
这里写图片描述
这里写图片描述
这里写图片描述

三、 HDFS HA 架构部署测试

<1>背景
这里写图片描述
<2>HDFS HA设计
这里写图片描述
这里写图片描述
<3>QJM HA配置
这里写图片描述
注意: HA配置的四个要点:
* share edits
JournalNode
* NameNode
Active,Standby
* Client
Proxy
* fence
同一时刻仅仅有一个NameNode对外提供服务
使用的方式sshfence
两个NameNode之间能够ssh无密码登录
<4>QJM HA的启动
这里写图片描述
<5>NN HA自动故障转移
这里写图片描述
这里写图片描述
这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值