大数据技术原理与应用——第二章

Hadoop简介

Hadoop基于Java开发,核心是Hadoop分布式文件系统(HDFS)、MapReduce
特性:
1. 高可靠性
2. 高效性
3. 高可扩展性
4. 高容错性
5. 成本低
6. 运行再Linux操作系统上
7. 支持多种编程语言

Hadoop生态

名称作用
HDFS两大核心之一、处理超大数据、流式处理、可运行在廉价商用服务器上
HBase提供高可靠性、高性能、可伸缩、实时读写、分布式的数据库
MapReduce编程模型,用于大规模数据并行计算,抽象为两个函数,“分而治之”
Hive数据仓库工具、HiveQL
Pig一种数据流语言和运行环境
Mahout一个开源项目、提供机器学习领域的算法
Flume高可用、高可靠、分布式的海量日志采集、聚合和传输的系统
ZooKeeper高效和可协同工作的工作系统,提供分布式锁之类的基本服务
Sqoop用来在Hadoop与关系数据库间交换数据,Java数据库连接jdbc与数据库交互
Ambari基于web的工具,支持Hadoop集群的安装、部署、配置和管理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值