Hadoop学习——(2) 安装过程记录(Ubuntu上的伪分布模式)

本文详细记录了在Ubuntu16.04上搭建Hadoop 2.6.5伪分布模式的步骤,包括环境配置、JDK安装、Hadoop安装、配置Hadoop环境、启动和关闭Hadoop服务,以及提交HDFS作业的过程。
摘要由CSDN通过智能技术生成

Hadoop有三种操作模式,分别为单机模式,伪分布模式和全分布模式。

本文简单介绍和区分三种操作模式,并参考网上的文章,记录自己搭建伪分布模式集群的过程。

最后使用hadoop提供的example程序尝试运行。

1. Hadoop的三种模式

单机模式

  • Hadoop的默认操作模式,该模式主要用于开发调试MapReduce程序的应用逻辑,而不会和守护进程交互
  • 使用本地文件而不是HDFS
  • 不会启动NameNodeDataNode等守护进程,MapTask和ReduceTask作为同一进程的不同部分来执行

伪分布模式

  • 操作是指在“单节点集群”上运行Hadoop,即一台主机模拟多台主机,NameNodeDataNode守护进程都运行在同一台机器上,是相互独立的Java进程

  • 该模式在单机模式操作之上多了代码调试功能,可以查阅内存的使用情况、HDFS的输入输出以及守护进程之间的交互

全分布模式

  • 实际意义上的Hadoop集群,守护进程运行在多台主机搭建的集群上
  • 需要在所有主机安装JDK和Hadoop,组成相互连通的网络
  • 在主机间设置SSH免密码登陆,把各个从节点(slave node) 生成的公钥添加到主节点的信任列表

2. 环境

  • 系统:ubuntu16.04

  • JDK版本:jdk1.8.0_201

  • hadoop版本:hadoop-2.6.5

3. JDK安装

  1. 下载JDK1.8,打开链接JDK 1.8,选择Linux x64,下载得到jdk-8u201-linux-x64.tar.gz
  2. 使用tar命令解压,并放在/opt/jdk1.8.0_201,若对/opt没有权限,可以使用chown命令修改拥有者
tar -xf jdk-8u201-linux-x64.tar.gz #解压
(chown [用户名] /opt)				#修改拥有者
mv jdk1.8.0_201 /opt/              #移动到opt目录下
  1. 配置JDK的环境变量,即在/etc/profile文件中加入对应语句
vim /etc/profile #打开配置文件
#添加两行代码
export JAVA_HOME=/opt/jdk1.8.0_201
export PATH=$PATH:$JAVA_HOME/bin
  1. 激活环境变量
source /etc/profile
java -version #检查是否安装成功
  1. 这样每次启动terminal时都得激活一次环境变量,我的处理方式是修改用户目录下的.bashrc文件,使得每次启动时自动执行激活环境变量的操作,如下:
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值