Hadoop集群搭建的总结

最新推荐文章于 2024-09-21 19:19:30 发布

qq_40178533

最新推荐文章于 2024-09-21 19:19:30 发布

阅读量3.2k

点赞数 1

分类专栏：大数据学习文章标签： hadoop 大数据 centos java

本文链接：https://blog.csdn.net/qq_40178533/article/details/106332754

版权

大数据学习专栏收录该内容

15 篇文章 1 订阅

订阅专栏

准备工作

虚拟机安装三台linux，可以先安装一台虚拟器，然后进行克隆。这里我使用的是：centos 6.5

ip配置

配置网络虚拟编辑器。如果是采用克隆的机器，注意修改mac地址，和ip地址。
在这里插入图片描述

修改主机名

vi /etc/sysconfig/network

设置一台机器为master ,另外两台为：node1,node2。

集群搭建步骤

1.设置ip：使用命令service network restart 重启网卡
在这里插入图片描述
2.关闭防火墙：使用命令service iptables stop

3.关闭防火墙的自动启动：使用命令chkconfig iptables off

4.设置主机名：修改配置文件vi /etc/sysconfig/network
在这里插入图片描述
5.设置主机名与ip的映射：修改配置文件vi /etc/hosts

6.设置ssh免密码登录
6.1主节点执行命令ssh-keygen -t rsa 产生密钥一直回车
执行命令

将密钥拷贝到其他两个子节点，命令如下：
ssh-copy-id -i node1
ssh-copy-id -i node2
实现免密码登录到子节点。
验证命令，在主节点通过命令： ssh node1
第一次需要输入密码，后面可以不需要输入密码登录
退出命令 exit。
7.安装jdk
上传解压jkd,并配置环境变量。
在这里插入图片描述
8.上传hadoop的jar包到虚拟机
9.解压:tar -zxvf hadoop-2.6.0.tar.gz 解压完后会出现 hadoop-2.6.0的目录
10.修改master中hadoop的一个配置文件:/解压路径/etc/hadoop/slaves
删除原来的所有内容，修改为如下：

11.修改hadoop的几个组件的配置文件

修改hadoop-env.sh文件

/usr/local/java/jdk1.8.0_171
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

修改 core-site.xml
将下面的配置参数加入进去修改成对应自己的

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/usr/local/soft/hadoop-2.6.0/tmp</value>
        </property>
	    <property>
                 <name>fs.trash.interval</name>
                 <value>1440</value>
        </property>
</configuration>

修改 hdfs-site.xml 将dfs.replication设置为1

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>
</configuration>

修改文件yarn-site.xml

<configuration>
        <property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>
</configuration>

修改 mapred-site.xml（将mapred-site.xml.template 复制一份为 mapred-site.xml）

<configuration>
   <property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
	<property>  
		<name>mapreduce.jobhistory.address</name>  
		<value>master:10020</value>  
	</property>  
	<property>  
		<name>mapreduce.jobhistory.webapp.address</name>  
		<value>master:19888</value>  
	</property> 
</configuration>

12，将hadoop的安装目录分别拷贝到其他子节点

 scp -r /安装路径/hadoop-2.6.0  node1:/安装路径/soft/
 scp -r /安装路径/hadoop-2.6.0  node2:/安装路径/soft/

13 启动hadoop
先自己建立tmp文件夹。执行一次格式化命令：

./bin/hdfs namenode -format

然后 /安装路径/hadoop-2.6.0目录下：启动执行./sbin/start-all.sh
14.验证hdfs：
可以登录浏览器地址：192.168.1.80:50070
看到下面页面证明 hdfs装好了
在这里插入图片描述

qq_40178533

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录