大数据技术与原理第二章

大数据处理架构Hadoop

Hadoop生态系统

1. HDFS
在这里插入图片描述

2. HBase
在这里插入图片描述

3. MapReduce
在这里插入图片描述
在这里插入图片描述

4. Hive
在这里插入图片描述

5. Pig
在这里插入图片描述

6. Mahout
在这里插入图片描述

7. Zookeeper
在这里插入图片描述

8. Flume

在这里插入图片描述

9. Sqoop
在这里插入图片描述
在这里插入图片描述

10. Ambari
在这里插入图片描述

Hadoop简介

  • 1.Hadoop是Apache软件基金会旗下的一个开源分布式计算平台
  • 2.Hadoop是基于Java语言开发的
  • 3.Hadoop的核心是分布式文件系统HDFS和分布式计算框架MapReduce
  • 4.HDFS是针对谷歌文件系统GFS的开源实现 MapReduce是针对谷歌MapReduce的开源实现
  • 5.创始人为Doug Cutting
  • 6.源于Apache Nutch项目

Hadoop特性

  1. 高可靠性
  2. 高效性
  3. 高可扩展性
  4. 高容错性
  5. 成本低
  6. 运行在Linux平台上
  7. 支持多种编程语言
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值