Hadoop权威指南(第三版)学习笔记之一初识Hadoop
第1章 初识Hadoop1.1 数据!数据!大数据1ZB=1000EB=10^6^PB=10^9^TB=10^21^ 字节,相当于世界上每个人一个硬盘驱动器所能容纳数据的数量级。推荐系统中“大量数据胜于好的算法”。1.2 数据存储与分析1TB硬盘,按其传输熟读约为100MB/s来算,读取整个硬盘数据需要约2.5h,但是将相同内容存放在100个硬盘中,每个存储1%,并行读取,用时不超过2min。实际情
原创
2017-10-10 18:26:06 ·
775 阅读 ·
0 评论