hadoop伪分布平台的搭建

最新推荐文章于 2023-04-09 21:53:13 发布

永不言弃01

最新推荐文章于 2023-04-09 21:53:13 发布

阅读量1.1k

点赞数

分类专栏：其他云计算与大数据文章标签： hadoop 单机模式伪分布模式安装 linux下JDK

本文链接：https://blog.csdn.net/lvsaixia/article/details/41388463

版权

云计算与大数据同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

其他

3 篇文章 0 订阅

订阅专栏

Hadoop单机模式和伪分布模式的搭建

转载说明出处：http://blog.csdn.net/lvsaixia/article/details/41388463

Hadoop集群支持3种运行模式，即单机模式、伪分布模式和全分布模式。本文主要讲解单机模式和伪分布模式的搭建，在接下来的文章中将继续讲解全分布模式的搭建。（文章中所使用到的配置文件下载地址）

1、Java安装（JDK）

Hadoop的运行需要JDK的支持，所以首先到官网下载对应版本的jdk，然后解压压缩包。把解压的文件放入opt文件夹下（可以根据个人习惯放置）。然后，配置在/etc/profile文件末尾添加JAVA的HOME目录(JAVA_HOME为bin文件所在的目录)。

/etc/profile文件末尾添加：

export JAVA_HOME=/opt/jdk-8u25-linux-i586/jdk1.8.0_25
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=$JAVA_HOME/lib:$JRE_HOME/lib:CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

测试：

在终端输入Java，有与JDK相对应的信息输出，说明JDK已经配置好了。

2、Hadoop的安装

与java（JDK）的按照类似，先下载Hadoop稳定版，解压备用。把解压文件复制到opt文件下下，接着在/etc/profile文件的末尾添加Hadoop的Home路径。应为Hadoop的运行需要JDK的支持，接下来修改Hadoop conf目录下的hadoop-env.sh文件中的java路径，修改为第一步配置的JAVA_HOME路径（需要绝对路径，直接写JAVA_HOME不行）。

/etc/profile文件末尾添加：

export HADOOP_HOME=/opt/hadoop-1.2.1/hadoop-1.2.1
export PATH=$HADOOP_HOME/bin:$PATH

Hadoop conf/hadoop-env.sh文件中添加：

export JAVA_HOME=/opt/jdk-8u25-linux-i586/jdk1.8.0_25

测试：

在终端中输入hadoop，如果出现与hadoop相关的信息，说明已经安装成功。

3、Hadoop单机模式配置

单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时，默认配置选择的是最小配置。默认模式下Hadoop的三个XML文件（core-site.xml，mapred-site.xml, hdfs-site.xml）都为空，注：不同版本有所区别。Hadoop会安全的运行在本地。单机模式不适用HDFS，也不加载任何Hadoop的守护进程。该模式主要用来调试MapReduce程序的应用逻辑。

4、Hadoop伪分布是模式配置

Hadoop可在单节点上以伪分布模式运行，用不同的Java进程模拟分布式运行中各类节点（NameNode、DataNode、JobTracker、TaskTracker、Secondary NameNode）。

（1）配置Hadoop

在Hadoop的三个配置文件中添对应信息。

core-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

	<property>
		<name>fs.default.name</name>		
	</property>

</configuration>

hdfs-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>	

	<property>
		<name>dfs.replication</name>
		<value>2</value>
	</property>	

</configuration>

mapred-sit.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
	<property>
		<name>mapred.job.tracker</name>
		<value>localhost:9001</value>
	</property>
</configuration>

(2)设置免密钥SSH

生成密钥对，执行以下命令：（需要openssh软件）