hadoop 初探

这个算是hadoop权威指南的读书笔记吧

古代,人们用牛来拉重物,当一头牛拉不动一根圆木时,他们不曾想过培育更大更壮的牛,同样,我们也不需要尝试开发超级计算机,而应试着结合使用更多计算机系统。

数据存储和分析的思考

当单块磁盘储存容量出现瓶颈的时候,是否考虑可以使用更多的磁盘,而不是尝试增大单块磁盘的容量,另外一个问题是大数据的分析。而hadoop的核心功能就是提供这些数据的存储和分析,对应到其组件就是 MapReduce 和HDFS。

数据库系统的思考

关系型数据库

Apache Hadoop 和Hadoop生态圈

Common

一组分布式文件系统通用I/O的组件和接口

Avro

一种支持高效,跨语言的RPC以及永久存储数据的序列化系统

MapReduce

分布式数据处理模型和执行环境,运行于大型商用机集群

HDFS

分布式文件系统

Pig

一种数据流语言和运行环境,用以检索非常大的数据集,Pig运行在MapReduce和HDFS的集群之上,

Hive

一个分布式,按列存储的数据仓库,Hive管理HDFS中存储数据,并提供基于SQL的查询语言(由运行时引擎翻译成MapReduce作业)用以查询数据

Hbase

一个分布式,按列存储数据库,HBase使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询(随机读取)

Zookeeper

一个分布式,可用性的协调服务。Zookeeper提供分布式锁知类的基本服务用于构建分布式应用


Sqoop

在数据库和HDFS之间高效传输数据的工具

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值