大数据知识点全讲解之Hadoop

Hadoop介绍

Hadoop是一个开源分布式系统架构

狭义上来说,hadoop单独指代hadoop这个软件

  • HDFS:分布式文件系统
  • Mapreduce:分布式计算系统
  • Yarn:分布式样集群资源管理

广义上来说,hadoop指代大数据的一个生态圈,包括很多其他的软件

  • zookeeper
  • hbase
  • hive

Hadoop的生态圈

现在,Hadoop是处理海量数据的架构首选,它可以非常快得完成大数据计算任务

Hadoop豆知识

Hadoop历史版本:

1.x版本系列:hadoop版本当中的第二代开源版本
2.x版本系列:架构产生重大变化,引入yarn平台等许多新特性
3.x版本系列:加入多namenode新特性

Hadoop三大发行公司:

Apache
HortonWorks
ClouderaManager

为什么使用Hadoop

  • 高扩展性,可伸缩
  • 高可靠性
    多副本机制,容错高
  • 低成本
  • 无共享架构
  • 灵活,可存储任意类型数据
  • 开源,社区活跃

Hadoop架构

HDFS(Hadoop Distributed File System)
分布式文件系统,解决分布式存储

MapReduce
分布式计算框架

YARN
分布式资源管理系统,在Hadoop 2.x中引入

Common
支持所有其他模块的公共工具程序

Hadoop搭建

Hadoop的安装、配置、初步使用!(附加集群)

如何手动搭建Hadoop-HA(高可用)模式?(内含报错和解决方法)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值