Hadoop权威指南 第四版 学习笔记系列(第一章:初始Hadoop)

1 .

传统的关系型数据库MapReduce
数据大小GBPB
数据读取交互式和批处理批处理
更新多次读/写一次写入,多次读取
事务ACID
结构写时模式读时模式
完整性
横向扩展非线性的线性的

2.数据本地化特性是Hadoop数据处理的核心

3.SETI@home :Search for Extra-Terrestrial Intelligence,在该项目中,志愿者把自己的计算机CPU的空闲时间贡献出来分析无线天文望远镜的数据,借此寻找外星智慧生命型号。志愿计算将问题分成很多块,每一块成为一个数据单元,发到各地的计算机上进行分析。完成分析后,结果发回服务器。为防止欺骗,每个工作单元要发送到3台不同的机器上执行而且收到的结果中至少有两个相同才会被接受。

4.SETI@home与Hadoop的不同:SETI@home问题是CPU高度密集的,适合在全球成千上万台计算机上运行,因为计算所花的时间远远超过数据的传输时间,也就是说,志愿者贡献的是CPU周期,而不是网络带宽。Hadoop 则是为了只需要短短几分钟或几个小时就可以完成的作业提供服务,并且数据中心内的计算机都是可靠的,专门的硬件。

5.本书的结构及阅读顺序:

图片来自Hadoop权威指南 第四版P17

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值