Hadoop 2X伪分布式环境搭建

最新推荐文章于 2023-10-10 00:22:03 发布

漫长学习路

最新推荐文章于 2023-10-10 00:22:03 发布

阅读量448

点赞数

分类专栏：大数据高并发大数据云计算分布式

本文链接：https://blog.csdn.net/liaodehong/article/details/78483586

版权

大数据高并发同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

大数据云计算分布式

3 篇文章 0 订阅

订阅专栏

从0开始搭建一套伪分布式环境，然后跑一个程序验证一下环境是否搭建成功。

1.hostname

首先第一步查看自己的linux的houstname。

如果没有的请设置一下vi /etc/hosts

注意修改完host文件只后需要重启，然后也要改一下hostname

hostname aliyeye

2.下载解压hadoop

我这里下载的是hadoop2.5最好是下载2.X左右的，然后上传到自己的linux文件夹里面

tar -zxf hadoop-2.5.0.tar.gz -C /opt/mudules/

没有下载JDK和配置环境变量的自己先去配置下

3.建议：删除rm -rf doc/ 里面是英文文档，没有作用。然后ls查看一下文件目录

4.修改配置文件

这里要把配置文件一个一个的修改过来。配置文件都在etc/hadoop里面。

hadoop-env.sh、mapred、yarn指定Java的安装路径。打开文件我们发现里面有

这一行代码，这里给他指定路径，或者变量都可以。

slaves，指定从节点位置，包括datanode和nodemanager
这里直接输入自己的hostname名称就好比如我的是aliyeye

core-site.xml，指定namenode所在机器位置及交互端口号，另外也是指定使用的是HDFS文件系统

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://aliyeye:8020</value>
</property>

注意了这里的aliyeye是我们刚才配置的hostname，后面也会用到，不是必须用hostname的，用ip也是可以的，但是最好使用hostname，因为hadoop底层代码中，有一些数据的访问获取什么的都是需要通过hostname的

所以最好还是hostname。

hdfs-site.xml 指定副本数个数

<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>

core-site.xml，更改Hadoop默认的临时目录位置，用于存放块文件和元数据文件

<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/modules/hadoop-2.5.0/data/tmp</value>
</property>

mapred-site.xml

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>

yarn-site.xml

<property>
        <name>yarn.nodemanager.aux-services
        </name>
        <value>mapreduce_shuffle</value>
</property>
<property>
	<name>yarn.resourcemanager.hostname</name>
	<value>hadoop-senior01.ibeifeng.com</value>
</property>

格式化一下
bin/hdfs namenode -format

然后启动
sbin/start-all.sh
或者可以一个一个的启动
sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start namenode
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager

启动完成之后我们可以通过jps查看一下进程