Hadoop(1) Hadoop简介和Hadoop的安装


Hadoop(1)
Hadoop简介和Hadoop的安装

Hadoop 简介

Hadoop概念
  1. 由Apache基金会开发的一个分布式系统基础架构
  2. 主要解决海量数据的存储和海量数据的计算问题
  3. 借鉴了谷歌的GFS和Map-Reduce方面的两篇论文
Hadoop的常见发行版本
  • Apache

原始版本

  • Cloudera

大型互联网企业中使用较多

  • Hortonworks

文档较好

Hadoop的版本

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nWPoptwR-1577090421576)(未命名.assets/1576677600746.png)]

  1. Hadoop1.0:包含了HDFS以及MapReduce
  2. Hadoop2.0:包含了HDFS、MapReduce以及Yarn.Hadoop2.0和Hadoop1.0完全不兼容,在Hadoop2.0的高本版中,也支持Ozone
  3. Hadoop3.0:包含了Hadoop所有的模块
Hadoop的优势
  1. 高可靠性

    有多个副本

    高扩展性

  2. 高效性

    计算机任务可以并行运行

  3. 高容错性

    能够自动将失败的任务重新分配

Hadoop的组成

现在常用的是Hadoop2.x版本,所以现在常见的组成:

HDFS(存储数据)
  • NameNode: 存储元数据,相当于一个索引,只有一个
    DataNode: 文件数据块,有备份,可以有多个
    Secondary NameNode: HDFS状态的后台辅助程序
MapReduce (计算)
  • Maper
  • Reducer
Yarn(资源调度)

在这里插入图片描述

  • ResourceManager:

    只有一个,负责处理客户端的请求,和整个集群的调度

  • NodeManager:

    管理单个节点

  • ApplicationMaster:

    一个临时的管理程序,一个任务对应一个

  • Container:

    容器,封装了某个节点的资源

Common(辅助工具)


Hadoop的安装

  1. 将Hadoop的tar.gz安装包解压(一般是 /opt/ 目录下)
tar -zxv -f hadoop-2.7.7.tar.gz -C /opt/module/
  1. 配置Hadoop的环境变量(/etc/profile)
vim /etc/profile

添加以下内容:

export HADOOP_HOME=/opt/hadoop-2.7.7(这个是刚刚Hadoop解压到的目录路径)
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后保存退出

  1. 加载配置文件
source /etc/profile
  1. 测试是否安装成功
hadoop version
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值