《Spark 最佳实践》阅读笔记

《Spark 最佳实践》阅读笔记

此文为Up阅读《Spark 最佳实践》的过程所记的笔记。

Hadoop生态系统

Hadoop是谷歌大数据解决方案的开源实现,使用Java语言开发,其核心内容主要是两部分:分布式文件系统(HDFS)和MapReduce。

  • Hive
    是HDFS和MapReduce上提供一个类似于SQL风格的抽象层,非常容易上手。
  • HBase
    是基于Hadoop的非关系型数据库,具备分布式、可扩展的特点,支持在几十亿行、数百万列的一张大表上进行实时、随机的读写访问。经典场景有各种数据仓库,比如淘宝用户历史订单查询等。
  • Zookeeper
    是提供分布式应用协调服务的系统,是谷歌的Chubby一个开源的实现,是Hadoop和HBase的重要组件。

持续更新...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值