第1章、Spark初探之Hadoop与Spark历史
1.(1)Hadoop历史
-
Hadoop起源于Google的三大论文
2003,2004年:
————1.GFS:Google的分布式文件系统,可用于处理海量网页的存储;
————2.MapReduce:Google的MapReduce开源分布式并行计算框架,可用于处理海量网页的索引计算2006年:
————BigTable:一个大型的分布式数据库演变历程:
GFS—->HDFS
Google MapReduce—->Hadoop MapReduce
BigTable—->HBase
1.(2)Spark历史
萌新,做的不好的还望大佬们指出。