伪分布式搭建
伪分布式: 就是所有角色在一个节点上
创建虚拟机
- 设置本台虚拟机名称 vi /etc/sysconfig/network 如图:
- 修改网络配置信息 vi /etc/sysconfig/network-scripts/ifcfg-eth0如图:
- IPADDR:设置ip地址(集群之间ip不可以重复包括虚拟机名称)
- ONBOOT改成yes
- BOOTTPROTO改成static
- NETMASK=设置子网掩码
- GATEWAY设置网关
设置完网络配置信息之后 需要重新启动network 让配置生效
service network restart
如图这样就网络配置就生效了
然后我们需要查看网络是否连接 ping www.baidu.com 如图
上传文件
上传jdk
hadoop依赖于jdk 所以我们需要 linux版本的jdk安装包
上传文件的两种方式:
1. 安装xftp软件 传输文件
2. 使用命令 rz 需要安装 yum install lrzsz -y
解压文件
tar -zxvf jdk
配置环境变量
export JAVA_HOME=/opt/software/jdk1.8.0_121
export PATH=$PATH:$JAVA_HOME/bin
作用 :在任何目录都可以进行执行bin的命令
配置完环境变量需要让环境变量生效 -----source /etc/profile
配置环境变量的两个地方:
1. 用户变量 .bashsrc 下配置
2. 系统变量 /etc/profile 下配置
上传hadoop
解压安装包 tar -zxvf hadoop-2.6.5.tar.gz
hadoop-2.6.5目录下:
1.bin–系统的操作命令(文件的增删改查)
2.sbin–系统的管理命令(集群的启动关闭)
3.etc/hadoop/ 目录下是hadoop的配置信息:
配置信息: 1. slave–节点(DN) 设置虚拟机名称 要与/etc/hosts和 /etc /sysconfig/network的名称一致