Hadoop简单集群搭建(适合初学者学习)

一、Linux环境搭建


1.注意事项


1.1 确认VmWare服务已启动

[外链图片转存失败(img-ZLt1fyTA-1565960033438)(assets/1557933410192.png)]

1.2 确认VmWare网关地址

[外链图片转存失败(img-dGkaYC0j-1565960033439)(assets/1557933777278.png)]

1.3 确认宿主机IP地址和DNS

[外链图片转存失败(img-OkXQOy1s-1565960033439)(assets/1557933985023.png)]

2.复制虚拟机


2.1 虚拟机拷贝

将虚拟机文件夹复制三份,并分别重命名, 并使用VM打开重命名

1557934271494.png


[外链图片转存失败(img-Zh8XrZf3-1565960033439)(assets/1557934570545.png)]

2.2设置三台虚拟机内存
  • 需要三台虚拟机, 并且需要同时运行, 所以总体上的占用为: 每 台 虚 拟 机 内 存 × 3 每台虚拟机内存 \times 3 ×3
  • 在分配的时候, 需要在总内存大小的基础上, 减去2G-4G作为系统内存, 剩余的除以3, 作为每台虚拟机的内存

每台机器的内存 = ( 总内存 - 4 ) / 3

[外链图片转存失败(img-qbYTwvL8-1565960033440)(assets/1557934712248.png)]

3.启动虚拟机并修改Mac和IP

3.1 集群规划
IP 主机名 环境配置 安装
192.168.174.100 node01 关防火墙和selinux, host映射, 时钟同步 JDK
192.168.174.110 node02 关防火墙和selinux, host映射, 时钟同步 JDK
192.168.174.120 node03 关防火墙和selinux, host映射, 时钟同步 JDK
3.2 设置ip和Mac地址

每台虚拟机更改mac地址:

vim /etc/udev/rules.d/70-persistent-net.rules

在这里插入图片描述

每台虚拟机更改IP地址:

vim /etc/sysconfig/network-scripts/ifcfg-eth0

在这里插入图片描述

每台虚拟机修改对应主机名(重启后永久生效)

vi /ect/sysconfig/network

HOSTNAME=node01

每台虚拟机设置ip和域名映射

vim /etc/hosts

在这里插入图片描述

3.3 inux系统重启

关机重启linux系统即可进行联网了

第二台第三台机器重复上述步骤,并设置IP网址为192.168.174.110,192.168.174.120

4.关闭防火墙和SELinux

  • 节点:集权中一台服务器就是一个节点
  • node01.hadoop.com 全限定域名 FQDN
  • 防火墙 – 端口号 22 8080等
  • SELinux – 进程的权限
  • 工作的生产环境 — 防火墙、用户(sudo)、selinux
4.1 关闭防火墙

三台机器执行以下命令(root用户来执行)

service iptables stop   #关闭防火墙
chkconfig iptables off  #禁止开机启动
4.2 三台机器关闭selinux
  • 什么是SELinux
    • SELinux是Linux的一种安全子系统
    • Linux中的权限管理是针对于文件的, 而不是针对进程的, 也就是说, 如果root启动了某个进程, 则这个进程可以操作任何一个文件
    • SELinux在Linux的文件权限之外, 增加了对进程的限制, 进程只能在进程允许的范围内操作资源
  • 为什么要关闭SELinux
    • 如果开启了SELinux, 需要做非常复杂的配置, 才能正常使用系统, 在学习阶段, 在非生产环境, 一般不使用SELinux
  • SELinux的工作模式
    • enforcing 强制模式
    • permissive 宽容模式
    • disable 关闭
# 修改selinux的配置文件
vi /etc/selinux/config

在这里插入图片描述

4.3 三台机器机器免密码登录

在这里插入图片描述

  • 为什么要免密登录
    • Hadoop 节点众多, 所以一般在主节点启动从节点, 这个时候就需要程序自动在主节点登录到从节点中, 如果不能免密就每次都要输入密码, 非常麻烦
  • 免密 SSH 登录的原理
    1. 需要先在 B节点 配置 A节点 的公钥
    2. A节点 请求 B节点 要求登录
    3. B节点 使用 A节点 的公钥, 加密一段随机文本
    4. A节点 使用私钥解密, 并发回给 B节点
    5. B节点 验证文本是否正确

第一步:三台机器生成公钥与私钥

在三台机器执行以下命令,生成公钥与私钥

ssh-keygen -t rsa

执行该命令之后,按下三个回车即可

在这里插入图片描述

第二步:拷贝公钥到同一台机器

三台机器将拷贝公钥到第一台机器

三台机器执行命令:

ssh-copy-id node01

第三步:复制第一台机器的认证到其他机器

将第一台机器的公钥拷贝到其他机器上

在第一天机器上面指向以下命令

scp /root/.ssh/authorized_keys node02:/root/.ssh
scp /root/.ssh/authorized_keys node03:/root/.ssh

在这里插入图片描述

4.4三台机器时钟同步
  • 为什么需要时间同步
    • 因为很多分布式系统是有状态的, 比如说存储一个数据, A节点 记录的时间是 1, B节点 记录的时间是 2, 就会出问题
## 安装
yum install -y ntp

## 启动定时任务
crontab -e

#查看时间与日期
date

随后在输入界面键入

*/1 * * * * /usr/sbin/ntpdate ntp4.aliyun.com;#分钟、小时、天、月、星期
#每分钟与阿里的ntp4同步时间(到分种)
  • 与springTask相似 * * * * * * *(到秒)
  • /usr/sbin/ntpdate ntp4.aliyun.com – 时钟同步命令
  • 可以用 date命令查看linux当前时间是否正确

二、辅助软件JDK&mysql

1.三台机器安装jdk


1.1 卸载自带openjdk
rpm -qa | grep java
rpm -e java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64 tzdata-java-2016j-1.el6.noarch java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64
1.2 创建安装目录
#shell
mkdir -p /export/softwares  #软件包存放目录
mkdir -p /export/servers    #安装目录
1.3上传并解压
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值