6.hadoop文件数据库系列讲解

学习总结

hadoop由两大块组成:hadoop自身+hadoop生态
hadoop管理的是文件,也就是相当于一个windows的文件资源管理器,文件可以是任意文件格式
在这里插入图片描述

hadoop的核心组件

hadoop的核心组件有hdfs,yarn,mapreduce

  • hdfs是由两部分构成NameNode:节点目录DataNode:数据保存节点,NameNode数量可以少于DataNode
  • yarn是资源管理模块由两部分构成RouceManger:总的资源管理器,NodeManager:接收总的资源管理器调度的子资源管理器
  • mapredue是一个离线计算工具,用来指挥yarn做计算调度的
    在这里插入图片描述

hadoop生态

  • 数据存储扩展:hbase,kafa,flume
  • 数据计算查询:hive,spark
  • 任务调度:Ozie

hadoop版本

一、Hadoop 版本主要有四个,分别是:

  • Apache(最原始的版本,所有发行版均基于这个版本进行改进)
  • Cloudera版本(Cloudera’s Distribution Including Apache Hadoop,简称CDH)
  • Hortonworks版本(Hortonworks Data Platform,简称HDP)
  • CDP(CDH和HDP合并后的产品,是付费的没有免费版)

对于国内而言,绝大多数选择 CDH 版本,集成部署更加方便和易于管理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不被定义的号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值