Hadoop学习之二《Hadoop环境伪分布式环境搭建》

最新推荐文章于 2024-08-13 09:51:43 发布

黯雅悸动

最新推荐文章于 2024-08-13 09:51:43 发布

阅读量1.6k

点赞数

分类专栏： --------《Hadoop学习》文章标签：分布式 hadoop环境的搭建伪分布式的搭建过程 centos搭建hadoop

本文链接：https://blog.csdn.net/Mr_li13/article/details/52453063

版权

--------《Hadoop学习》专栏收录该内容

2 篇文章 0 订阅

订阅专栏

问题？Hadoop学习之二《Hadoop环境伪分布式环境搭建》

一、Hadoop定义

二、环境搭建

(1)资源下载

JDK1.7-Linux-64:点击下载链接

Hadoop2.2版本:点击下载链接

(2)配置过程

首先是，虚拟机要先安装好，而且网路要配置好。详情请看环境配置

1.设置网络，并且网络service networkrestart

2.创建组，并且创建hadoop用户设置密码（放到这个组中）

3.下载jdk1.7及hadoop2.2压缩包，并且使用WinSCP软件移动这两个文件到/usr/local下

解压jdk：tar –zxvf …… 并且重命名为jdk1.7

解压hadoop，并且移动到用户主目录下(这个时候这个文件只有root有权限，hadoop还没有，后面会给予权限)

在hadoop程序目录下创建文件夹:都是以后放一些数据文件的

给hadoopGroup组分配对此hadopp2.2文件的操作权限

给组分配读写执行权限

配置jdk的环境变量

查看是否配置成功

修改hadoop环境变量

查看是否生效

修改hadoop2.2里面etc下的配置文件，这个非常重要。配置不成功，后面的文件系统就会出错。

修改环境变量：export JAVA_HOME=/usr/local/jdk1.7/ (就只改这个，有些有#号的别去掉了。)

修改slaves文件

修改core-site.xml

<configuration>
 <property>
       <name>fs.defaultFS</name>
       <value>hdfs://node:9000</value>
       <description>configerate hostnameand port</description>
 </property>
 <property>
       <name>hadoop.tmp.dir</name>
       <value>/home/hadoop/hadoop2.2/tmp/hadoop-${user.name}</value>
        <description>storethe temp dir</description>
 </property>
 <property>
       <name>hadoop.proxyuser.hadoop.hosts</name>
       <value>*</value>
 </property>
<property>
       <name>hadoop.proxyuser.hadoop.groups</name>
       <value>*</value>
</property>
</configuration>

修改mapred-site.xml.temp

<configuration>
       <property>
              <name>mapreduce.framework.name</name>
              <value>yarn</value>
       </property>
       <property>
              <name>mapreduce.jobhistory.address</name>
              <value>node:10020</value>
       </property>
       <property>
              <name>mapreduce.jobhistory.wabapp.address</name>
              <value>node:19888</value>
       </property>
</configuration>

修改yarn-site.xml

<configuration>
 
<!--Site specific YARN configuration properties -->
       <property>
              <name>yarn.resourcemanager.hostname</name>
              <value>node</value>
       </property>
 
       <property>
              <name>yarn.nodemanager.aux-services</name>
              <value>mapreduce_shuffle</value>
       </property>
      
 
       <property>
              <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
              <value>org.apache.hadoop.mapred.ShuffleHandler</value>
       </property>
      
       <property>
              <name>yarn.resourcemanager.address</name>
              <value>node:8032</value>
       </property>
      
       <property>
              <name>yarn.resourcemanager.scheduler.address</name>
              <value>node:8030</value>
       </property>
      
       <property>
              <name>yarn.resourcemanager.resource-tracker.address</name>
              <value>node:8031</value>
       </property>
      
       <property>
              <name>yarn.resourcemanager.admin.address</name>
              <value>node:8033</value>
       </property>
 
       <property>
              <name>yarn.resourcemanager.webapp.address</name>
              <value>node:8088</value>
       </property>
</configuration>

修改hdfs-site.xml

<configuration>
       <property>
              <name>dfs.namenode.http-address</name>
              <value>node:50070</value>
              <description>namenodeaddress and port</description>
       </property>
 
       <property>
              <name>dfs.namenode.secondary.http-address</name>
              <value>node1:50090</value>
              <description>seconde addressand port</description>
       </property>
 
       <property>
              <name>dfs.replication</name>
              <value>3</value>
              <description>configeratehdfs store dir number,default :3</description>
       </property>
      
       <property>
              <name>dfs.namenode.name.dir</name>
              <value>file:///home/hadoop/hadoop2.2/hdfs/name</value>
              <description>namnode is usedto keep storing namespace and exchange the path of local log file</description>
       </property>
      
       <property>
              <name>dfs.datanode.data.dir</name>
              <value>file:///home/hadoop/hadoop2.2/hdfs/data</value>
              <description>datanode isstore local dir</description>
       </property>
 
       <property>
              <name>dfs.namenode.checkpiont.dir</name>
              <value>file:///home/hadoop/hadoop2.2/hdfs/namesecondary</value>
              <description>secondarynamenode</description>
       </property>
      
       <property>
              <name>dfs.webhdfs.enabled</name>
              <value>true</value>       
              <description>is it alowedto  view web hdfsfile</description>
       </property>
      
       <property>
              <name>dfs.stream-buffer-size</name>
              <value>131072</value>
              <description>buffer:4kb</description>
       </property>
      
</configuration>

修改主机名：这个只要在hdfs开启前改就行了，可以一开始就把主机名改了