-
改网络,重启服务,配置开机时为命令模式,切换为root用户
vi /etc/sysconfig/network-scripts/ifcfg-eth0
IPADDR=192.168.132.107
NETMASK=255.255.255.0
GATEWAY=192.168.132.2
DNS1=8.8.8.8
DNS2=8.8.4.4
vi /etc/inittab initdefault改为3
- 克隆两台机子,然后改IP为108,109 (可以根据自己情况改IP)
- 改主机名和地址映射关系,3台机子为bd7,bd8,bd9
- 关闭防火墙 切换为root用户
chkconfig iptables off
- 安装jdk,hadoop、zookeeper
- 配置SSH无密码登陆---三个机子轮流
ssh-keygen -t rsa---直接全部回车
ssh-copy-id bd7
ssh-copy-id bd8
ssh-copy-id bd9
测试 ssh bd8 ssh bd8 ssh bd9
- 配置zookeeper--具体可以自己再查下
- 配置Hadoop
环境变量(3台都弄)
vi /etc/profile
export JAVA_HOME=/home/bigdata02/app/jdk1.7.0_80
export HADOOP_HOME=/home/bigdata02/app/hadoop-2.7.3
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin::$HADOOP_HOME/sbin
source /etc/profile ----(生效)
Hadoop相关配置文件
修改hadoo-env.sh
export JAVA_HOME=/home/bigdata02/app/jdk1.7.0_80
修改core-site.xml
<configuration>
<!-- 指定hdfs的nameservice为master -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1:9000</value>
</property>
<!-- 指定缓存大小 -->
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
<!-- 指定hadoop临时目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/bigdata02/app/hadoop-2.7.3/data</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>bd7:2181,bd8:2181,bd9:2181</value>
</property>
</configuration>
修改hdfs-site.xml
<configuration>
<!--指定hdfs的nameservice为ns1,需要和core-site.xml中的保持一致 -->
<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>
<!-- ns1下面有两个NameNode,分别是nn1,nn2 -->
<property>
<name>dfs.ha.namenodes.bd7</name>
<value>nn1,nn2</value>
</property>
<!-- nn1的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>192.168.132.107:9000</value>
</property>
<!-- nn1的http通信地址 -->
<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>192.168.132.107:50070</value>
</property>
<!-- nn2的RPC通信地址 -->
<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>192.168.132.108:9000</value>
</property>
<!-- nn2的http通信地址 -->
<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>192.168.132.108:50070</value>
</property>
<!-- 指定NameNode的元数据在JournalNode上的存放位置 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://192.168.132.107:8485;192.168.132.108:8485;192.168.132.109:8485/ns1</value>
</property>
<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/home/bigdata02/app/hadoop-2.7.3/journal</value>
</property>
<!-- 开启NameNode失败自动切换 -->
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<!-- 配置失败自动切换实现方式 -->
<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!-- 配置隔离机制方法,多个机制用换行分割,即每个机制暂用一行-->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>
<!-- 使用sshfence隔离机制时需要ssh免登陆 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/home/hadoop/.ssh/id_rsa</value>
</property>
<!-- 配置sshfence隔离机制超时时间 -->
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>
修改mapred-site.xml
mv mapred-site.xml.template mapred-site.xml
<configuration>
<!-- 指定mr框架为yarn方式 -->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
修改yarn-site.xml
<configuration>
<!-- 指定resourcemanager地址 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>bd7</value>
</property>
<!-- 指定nodemanager启动时加载server的方式为shuffle server -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
修改slaves bd8,bd9 指定datanode,nodemanager
将配置好的hadoop拷贝到其他节点
###注意:严格按照下面的步骤
启动zookeeper集群(分别在bd7、bd8、bd9上启动zk)
./zkServer.sh start
#查看状态:一个leader,两个follower
./zkServer.sh status
启动journalnode(分别在bd7、bd8、bd9上执行)
hadoop-daemon.sh start journalnode
#运行jps命令检验
格式化HDFS
#在bd7上执行命令: hdfs namenode -format
#格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件,这里我配置的是/home/bigdata02/app/hadoop-2.7.3/data,然后将/home/bigdata02/app/hadoop-2.7.3/data拷贝到bd8的/home/bigdata02/app/hadoop-2.7.3下。
scp -r data/ bd8:/home/bigdata02/app/hadoop-2.7.3/
格式化ZK(在bd7上执行即可)
hdfs zkfc -formatZK
启动HDFS(在bd7上执行)
start-dfs.sh
启动YARN(在bd7上操作)
start-yarn.sh
到此,hadoop配置完毕,可以统计浏览器访问:
NameNode 'bd7:9000' (active)
NameNode 'bd8:9000' (standby)
- 安装hbase
- 配置hbase
把hadoop的hdfs-site.xml和core-site.xml 放到hbase/conf下
修改hbase-env.sh
export JAVA_HOME=/home/bigdata02/app/jdk1.7.0_80
//告诉hbase使用外部的zk
export HBASE_MANAGES_ZK=false
修改hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://ns1/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>bd7:2181,bd8:2181,bd9:2181</value>
</property>
</configuration>
regionservers
bd7
bd8
bd9
拷贝hbase到其他节点