搭建大数据平台的准备工作

1 网络原理

1.1 桥接原理

因为 虚拟机的linux系统的ip地址是固定的, 更换路由器后导致无法使用, 所以 不推荐使用

1.2 NAT原理

如果宿主电脑可以上网, 内部的虚拟机也可以上网就好了

NAT原理本质上就是 虚拟机实现了交换机的功能, linux系统的IP地址就不会随宿主电脑的ip地址更改而更改

推荐使用这种方式

2 怎么使linux上网

2.1 确保所有关于VMWare的服务都开启

计算机 --> 右键 '管理'

2.2 确保VMnet8 已经启动

2.3 设置VMware软件交换机的ip地址

再次确认

2.4 设置VMnet8的ip地址

2.5 更改linux系统的ip地址

vim /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
TYPE=Ethernet
UUID=aa810323-8568-4664-9123-221c3446eb79
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=none
DEFROUTE=yes
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
NAME="System eth0"
HWADDR=00:0c:29:be:cf:7b
PEERROUTES=yes
IPADDR=192.168.220.250
NETMASK=255.255.255.0
GATEWAY=192.168.220.1
DNS1=8.8.8.8
USERCTL=no

改完后保存

2.6 重启网卡服务

2.7 测试

3 防火墙

3.1 查看防火墙规则

查看防火墙状态

service iptables status

修改防火墙规则

vim /etc/sysconfig/iptables

放开某个端口号不被防火墙拦截,适用于部署tomcat,nginx等之类的软件:

设置完成后,需要重启防火墙.

重启防火墙

service iptables restart

3.2 关闭防火墙服务

service iptables stop

3.3 禁止防火墙关机自启动

chkconfig iptables off

查看自启动状态

chkconfig iptables --list
# 0 - 停机
# 1 - 单用户模式 
# 2 - 多用户,没有NFS 
# 3 - 完全多用户模式(标准的运行级) 
# 4 - 没有用到 
# 5 - X11(xwindow) 
# 6 - 重新启动 

注意: 在实际工作,大数据集群一般都是放置在内网当中,通过跳板机连接外网.

所以一般都是直接关闭防火墙即可, 但是在实际工作中,跳板机(web服务器)关闭防火墙要谨慎,避免服务器感染病毒

4 复制虚拟机

因为重新安装虚拟太慢了, 所以直接复制虚拟机

4.1 复制虚拟机

4.2 开启复制之后的虚拟机

注意:点击.vmx结尾的文件,就可以挂载上了

重命名

 

4.3 更改新增linux的mac地址

4.4 更改新增linux系统的网卡

vim /etc/udev/rules.d/70-persistent-net.rules

4.5 更改新增linux系统的网络设置

vim /etc/sysconfig/network-scripts/ifcfg-eth0

使用 reboot指令重启系统, 再次验证

5 时钟同步

5.1 原理

内网的所有服务器都和时钟服务器进行同步时间

5.2 如何同步

  1. 查看本机当前时间

date
  1. 设置本机当前时间

date -s "2018-08-17 20:08:09"
  1. 通过命名和时钟服务器同步时间:

ntpdate us.pool.ntp.org
  1. 编辑定时任务

crontab -e 

4.1 定时任务内容如下

*/1 * * * * /usr/sbin/ntpdate us.pool.ntp.org; 

6 主机名

6.1 更改主机名

vim /etc/sysconfig/network

6.1.1 内容

HOSTNAME=hadoop1

同理 更改每台linux的主机名

HOSTNAME=hadoop1

HOSTNAME=hadoop2

HOSTNAME=hadoop3

注意: 必须重启系统才可以生效

6.2 更改三台机器的主机名与ip地址的映射

vim  /etc/hosts

6.2.2 内容

192.168.220.250 hadoop1
192.168.220.251 hadoop2
192.168.220.252 hadoop3

6.3 三台虚拟机关闭selinux

vim /etc/selinux/config

SELINUX=disabled

关机重启才会生效.

7 SSH免密码登录

7.1 what?

7.2 远程访问方式一

[root@hadoop1 ~]# ssh hadoop2
root@hadoop2's password: 
Last login: Fri Aug 17 17:15:00 2018 from hadoop1
[root@hadoop2 ~]# ifconfig
eth0      Link encap:Ethernet  HWaddr 00:50:56:20:79:47  
          inet addr:192.168.220.252  Bcast:192.168.220.255  Mask:255.255.255.0
          inet6 addr: fe80::250:56ff:fe20:7947/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:839 errors:0 dropped:0 overruns:0 frame:0
          TX packets:580 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000 
          RX bytes:77419 (75.6 KiB)  TX bytes:55550 (54.2 KiB)
          Interrupt:19 Base address:0x2000 

lo        Link encap:Local Loopback  
          inet addr:127.0.0.1  Mask:255.0.0.0
          inet6 addr: ::1/128 Scope:Host
          UP LOOPBACK RUNNING  MTU:16436  Metric:1
          RX packets:114 errors:0 dropped:0 overruns:0 frame:0
          TX packets:114 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:0 
          RX bytes:6026 (5.8 KiB)  TX bytes:6026 (5.8 KiB)

[root@hadoop2 ~]# exit
logout
Connection to hadoop2 closed.

缺点: 每次都需要输入密码

7.2 远程访问方式二:免密码

在hadoop01上面直接生成公钥和私钥

ssh-keygen  四下回车

ll -a 进行查看,发现出现.ssh文件即已经生成

将此hadoop01的公钥拷贝到第二台机器上

ssh-copy-id root@hadoop02

将公钥拷贝到自身以及第三台机器

其他两台机器重复此步骤

如果后期遇见输入yes/no情况,重新生成秘钥或者直接将当前秘钥再次发到其他两台机器

 

7.3 用shell脚本一键安装jdk

流程

1.现在所有机器上执行以下命令:
yum -y install lszrz
2.下载jdk,并上传到一台机器中(这里如果用的是xshell可以直接拖动jdk到xshell即可)
或者是用以下命令:
rz
3.在一台机器中创建install_jdk.sh,然后把下面的代码复制进去。
#!/bin/bash

tar -zxvf /export/software/jdk-7u75-linux-x64.tar.gz -C /export/servers/

cd /export/servers/jdk1.7.0_75
home=`pwd`

echo $home

echo "export JAVA_HOME=${home}"  >> /etc/profile
echo "export PATH=:\$PATH:\$JAVA_HOME/bin" >> /etc/profile


for m in 1 2 3
do
scp -r /export/servers/jdk1.7.0_75 hadoop0$m:/export/servers/
ssh hadoop0$m "echo 'export JAVA_HOME=/export/servers/jdk1.7.0_75' >> /etc/profile; echo 'export PATH=:\$PATH:\$JAVA_HOME/bin' >> /etc/profile"

done
4.在所有机器上执行:source /etc/profile和java -version
来检查jdk是否安装好了。

至此,搭建hadoop 集群的准备工作就做好了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值