(一)、认识 hadoop

hadoop不是一个英文单词, 是作者(Doug Cutiing)发明的词, hadoop名称来源作者小孩的一个絨毛填充黄色大象玩具. 它的发音是:[hædu:p] – 嗨都泼

对于 hadoop 2.0 来说, 它的核心有三部分: HDFS、MapReduce 和 YARN, 其中 YARN 是 2.0 新加的, 它是为了解决 MapReduce 的缺陷, 有了它, hadoop 就可以很好的兼容 storm、spark等等框架.

理解下相关的关键字含义:

  • HDFS: 简单的理解成一种文件格式, 类似 FAT32、NTFS 这种.
  • MapReduce: 离线计算模型.
  • YARN: 资源协调者.
  • Storm: 流式计算模型.
  • Spark: 内存计算模型.
  • Hive: 数据仓库工具, 它是为了简化编写 MapReduce.
  • HBse: 一种分布式、面向列的开源数据库, 可以很好的使用在 HDFS 上.

HDFS

架构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值