Hadoop——第一部份 Hadoop入门——一、Hadoop概述

第一部份 Hadoop入门

一、Hadoop概述

  • 介绍
  • 发行版本
  • 特点
  • 组成
  • 大数据技术生态体系
1.1 Hadoop概念
  • Hadoop是Apache基金会开发的分布式系统基础架构
  • 主要解决海量数据存储和分析计算
  • 广义Hadoop指Hadoop生太圈
1.2 Hadoop发行版
  • Apache原始开源版
  • Cloudera商业版CDH
  • Hortonworks商业版HDP
  • 两家公司合并后的商业版CDP
1.3 Hadoop特点
  • 高可靠——多副本
  • 高扩展——动态增加服务器
  • 高效——并行工作
  • 高空错——失败任务重新分配
1.4 Hadoop组成
功能1.x2.x
计算MapReduceMapReduce
资源调度MapReduceYarn
数据存储HDFSHDFS
辅助工具CommonCommon
  1. HDFS
    HDFS(Hadoop Distributed File System)是Hadoop分布式文件系统。
  • NameNode(nn)——文件源数据
  • DataNode(dn)——文件数据
  • Secondary NameNode(2nn)——nn定期备份(非热备)

源数据,是描述数据的数据,用于描术数据的属性信息

  1. Yarn
    Yarn(Yet Another Resource Negotiator)是Hadoop资源管理器。
  • ResourcesManager(RM)——集群资源管理器
  • NodeManager(NM)——节点管理器
  • ApplicationMaster(AM)——应用管理器
  • Container——容器(独立服务器)
  1. MapReduce
  • Map阶段——并行处理输入数据
  • Reduce阶段——结果汇总
  1. 运作方式
1.5 大数据技术生态体系
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值