hadoop2.7.1 伪分布式搭建

原创 2015年12月14日 17:23:12

站在巨人的肩膀上: http://www.powerxing.com/install-hadoop-simplify/

本文适用于hadoop 2.x所有版本

OS:Ubuntu 14.04

Hadoop version: hadoop 2.7.1

JDK: 1.7


1. 前期准备

1.1 安装JDK 1.6以上版本

    1. $ sudo apt-get install openjdk-7-jre openjdk-7-jdk
    2. $ vim~/.bashrc# 设置JAVA_HOME
    3. #在/etc/profile中导入java环境变量
    4. $ sudo vim /etc/profile
    5. export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
$ source /etc/profile #使环境变量生效

1.2 配置ssh
$ sudo apt-get install openssh-server
$ ssh localhost  
$ exit  #退出localhost
#设置无密码登录
$ cd ~/.ssh  #在home目录下有一个隐藏文件.ssh
$ ssh-keygen -t rsa
$ cat id_rsa.pub >> authorized_keys
$ ssh localhost #登录localhost就不用再输入密码了
$ exit #退出localhost

2. 安装hadoop
http://mirror.bit.edu.cn/apache/hadoop/common/stable2/
$ wget http://mirror.bit.edu.cn/apache/hadoop/common/stable2/hadoop-2.7.1.tar.gz ~  #将Hadoop2.7.1压缩包下载到home目录下
$ tar -xzvf hadoop-2.7.1.tar.gz #解压
$ sudo mv hadoop-2.7.1 /usr/local/ #将hadoop2.7.1移动到/usr/local目录下,个人习惯而已,喜欢安装在Home目录下的忽略此步
$ sudo chown -R user:user hadoop-2.7.1 #改变hadoop-2.7.1文件夹的所属群组,如果在/usr/local下必须要改,否则缺少一些权限
$ cd /usr/local/hadoop-2.7.1
$ ./bin/hadoop #验证

3. 伪分布模式配置
3.1 修改配置文件core.xml
<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:<strong><span style="color:#ff0000;">/usr/local/hadoop-2.7.1</span></strong>/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

3.2 修改hdfs-site.xml
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop-2.7.1/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop-2.7.1/tmp/dfs/data</value>
    </property>
</configuration>

3.3 修改mapred-site.xml
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>

3.4 修改yarn-site.xml
<span style="font-size:10px;"><configuration>
<!-- Site specific YARN configuration properties -->
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
</configuration></span>

4. 启动hadoop
$ cd /usr/local/hadoop-2.7.1
$ sbin/start-all.sh
$ jps
Namenode
DataNode
NodeManager
ResourceManager
SecondaryNameNode


hadoop-2.4.1伪分布式搭建出现的namenode无法启动的问题

我把所有文件都配置成功了 ,进行hdfs namenode -format (hadoop namenode -format)是对namenode进行初始化也成功了,但是在启动HDFS(start-d...
  • yu0_zhang0
  • yu0_zhang0
  • 2017年10月30日 17:00
  • 144

Mac下hadoop2.7 伪分布式安装

一。MAC OS下的JDK安装及其路径 1、首先安装jdk,直接百度或者Google搜索就有MAC版本的jdk,本实验环境是jdk1.8.0_66.jdk,Hadoop的安装也必须在jdk 1.6版...
  • u013475704
  • u013475704
  • 2017年02月09日 10:58
  • 968

hadoop2.7.1伪分布式配置

Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode。 Hadoop 的配置文件位于 /usr/...
  • u011630575
  • u011630575
  • 2015年07月30日 15:51
  • 912

centos下hadoop2.7.1伪分布式搭建

Hadoop有三种运行模式,分别如下: 单机(非分布式)模式 伪分布式(用不同进程模仿分布式运行中的各类节点)模式 完全分布式模式 注:前两种可以在单机运行,最后一种用于真实的集群环境,通常用...
  • wuliowen
  • wuliowen
  • 2016年09月13日 20:58
  • 2943

hadoop2.6.0版本搭建伪分布式环境

由于个人需要在自己的笔记本上搭建hadoop伪分布环境,为了方便自己使用,如想看机器也看之前的一篇博客:hadoop2.6版本集群环境搭建...
  • stark_summer
  • stark_summer
  • 2015年02月06日 15:56
  • 47347

hadoop2.7.0版本搭建伪分布式环境

1.安装好SUSE 11系统,配置IP, 2,创建用户hadoop,属组,修改权限; useradd命令详解(实例) 1.作用 useradd命令用来建立用户帐号和创建用户的起始目录,使用权限是终...
  • wangquan52000
  • wangquan52000
  • 2015年07月25日 13:26
  • 733

Hadoop简单入门之伪分布式搭建

前面两章主要讲解了完全分布式的搭建,这章主要讲解服务器单机完成伪分布的搭建,介绍Hadoop配置,启动,以及简单测试。我的机器:阿里云服务器,64位,Java64,Hadoop2.4.1(64)...
  • peace1213
  • peace1213
  • 2016年05月08日 10:04
  • 2932

ubuntu14.04安装hadoop2.7.1

1.http://www.cnblogs.com/kinglau/p/3794433.html 一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组,同时在该组...
  • wm326707000
  • wm326707000
  • 2017年02月28日 21:13
  • 351

Spark2.0.1伪分布式安装配置

前言.Spark简介和hadoop的区别 Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还...
  • tongxinzhazha
  • tongxinzhazha
  • 2017年01月11日 18:23
  • 2795

Hadoop伪分布式-----Spark的安装和配置

在前面几章已经搭建好Hadoop环境,本节主要介绍在Hadoop基础上搭建Spark平台 1 下载所需安装包 1)下载spark安装包      2)下载Scala安装包,并解压安装包本例以下面版...
  • u012535605
  • u012535605
  • 2017年03月30日 20:27
  • 485
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:hadoop2.7.1 伪分布式搭建
举报原因:
原因补充:

(最多只允许输入30个字)