CentOS7上Hadoop 2.6.0集群的安装与配置 2

最新推荐文章于 2021-09-13 17:59:25 发布

starplayer

最新推荐文章于 2021-09-13 17:59:25 发布

阅读量73

点赞数

本文链接：https://blog.csdn.net/starplayer/article/details/45752233

版权

这篇博客详细介绍了在CentOS7上安装配置Hadoop 2.6.0集群的步骤，包括安装CentOS7、JDK，设置虚拟机网络IP，配置无密码登录，安装Hadoop以及集群配置。还涵盖了常见的问题及其解决方案，如权限问题和Windows系统下访问HDFS的困扰。

摘要由CSDN通过智能技术生成

1．CentOS7安装

（1）最小化安装CentOS7

（2）配置网络连接

vi/etc/sysconfig/network-scripts/ifcfg-eth0

修改：BOOTPROTO=static

ONBOOT=yes

添加：IPADDR= ipaddress（ip地址）

NETMASK=subnetmask（子网掩码）

GATEWAY=gateway(网关)

DNS1=dns ip1（DNS服务器1）

DNS2=dns ip2（DNS服务器2）

保存退出（:wq）

使用如下命令使配置生效

service network restart

cat /etc/resolv.conf显示

nameserverdns ip1

nameserverdns ip2

表明网络配置生效

（3）安装工具

yum-y install net-tools //ifconfignetstat等命令工具均被安装

yum–y install vim // vi编辑器升级版被安装

yum–y install wget // 远程下载工具被安装

yum –y installrsync // 远程同步工具

（4）关闭防火墙

systemctl stopfirewalld.service // 停止防火墙

systemctldisable firewalld.service // 系统重启后防火墙不再启动

2．JDK安装

mkdir /usr/java

cd /usr/java

wget ftp://localhost/jdk*.tar.gz // 下载jdk解压包

tar –zxvf jdk*.tar.gz //解压

vim /etc/profile //修改配置文件，添加环境变量如下：

#set jdk environment path

exportJAVA_HOME=/usr/java/jdk*

exportCLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar:${JAVA_HOME}/jre/rt.jar

exportPATH=$PATH:${JAVA_HOME}/bin:${JAVA_HOME}/jre/bin

保存退出（press ESC Key,and type :wq）

source /etc/profile //是配置生效

java –version //验证配置是否生效

3．将当前安装的虚拟机CentOS7连续复制三份，并恰当设置网络IP，使其生效。

同时配置各虚拟机的hostname：（可选）

hostnamectl set-hostname namenode //修改namenode的主机名

配置各机器的解析表：（可选）

vim /etc/hosts

192.168.1.100namenode

192.168.1.101 datanode1

……

4．配置namenode到datanode的无密码登录（名称节点到数据节点的无密码登录）

（1）在namenode上以root登录，并生成私钥-公钥对：

ssh-keygen–t rsa–P ‘’

（2）cd /root/.ssh

（3）cat id_rsa.pub >>authorized_keys（使本机的ssh可以无密码启动本机的命令）

（4）ssh-copy-id –i id_rsa.pub root@datanode1 // 将公钥复制到datanode1节点上，使namenode可以无密码登录到datanode1上

（5） vim config //设置ssh配置，使首次远程登陆免打扰，文件中输入如下内容

StrictHostKeyCheckingno

5．安装Hadoop

mkdir /usr/hadoop

cd /usr/hadoop

wget ftp://ftpserver/hadoop-2.6.0.tar.gz

tar –zxvfhadoop-2.6.0.tar.gz

6．Hadoop集群配置

（1）准备环境

cd /usr/hadoop/hadoop-2.6.0

vimetc/hadoop/hadoop-env.sh

# set to the root of your Java installation

export JAVA_HOME=/usr/java/jdk* //JDK的安装目录

# Assuming your installation directory is/usr/hadoop/hadoop-2.6.0

export HADOOP_PREFIX=/usr/hadoop/hadoop-2.6.0 // hadoop的安装目录

vimetc/hadoop/yarn-env.sh

exportJAVA_HOME=/usr/java/jdk*

（2）修改配置文件

vim${HADOOP_HOME}/etc/hadoop/core-site.xml

[html] view plain copy print ?

// # core-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://210.47.163.199:9000/</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
</configuration>
// #hdfs-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///usr/hadoop/hadoop-2.6.0/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///usr/hadoop/hadoop-2.6.0/dfs/data</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
</configuration>
//#yarn-site.xml
<?xml version="1.0"?>
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>210.47.163.199</value>
</property>
</configuration>
#mapred-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>210.47.163.199:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>210.47.163.199:19888</value>
</property>
</configuration>

// # core-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://210.47.163.199:9000/</value>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
</configuration>

// #hdfs-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///usr/hadoop/hadoop-2.6.0/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///usr/hadoop/hadoop-2.6.0/dfs/data</value>
</property>
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>
</configuration>

//#yarn-site.xml
<?xml version="1.0"?>
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>210.47.163.199</value>
</property>
</configuration>

#mapred-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>210.47.163.199:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>210.47.163.199:19888</value>
</property>
</configuration>

#slaves //配置从机datanodenodemanager

192.168.1.101

192.168.1.102

……