《Hadoop 权威指南 - 大数据的存储与分析》学习笔记
第一章 初识Hadoop1.2 数据的存储与分析对多个硬盘中的数据并行进行读/写数据,有以下两个重要问题:硬件故障问题。解决方案:复制(replication),系统保存数据的副本(replica)。以某种方式结合大部分数据来共同完成分析。MapReduce 提出一个编程模型,该模型抽象出这些硬件读/写问题,并且将其转换成对一个数据集(由键-值对组成)的计算。简而言之,Hadoop 为...
原创
2018-10-30 19:27:58 ·
881 阅读 ·
3 评论