说起大数据生态体系的起源,不得不提Doug Cutting,这位大数据技术始祖级的人物,在Google的影响下为我们带来了大数据生态体系中最原始也最重要的部分—Hadoop。
Doug Cutting,上图居中着,身高一米八往上,其貌不扬,为人谦逊,因其儿子喜欢的玩具为技术发明命名。
1985,毕业于斯坦福大学。
1997,发布Lucene,第一个全文文本搜索开源函数库(流行搜索引擎Solr和Elasticsearch的基石)。
2010,当选Apache Software Foundation主席。
2015,被O’Reilly授予Open Source Award荣誉。(同样被授奖的还有Ceph作者、nodejs作者等,开源人士梦寐以求的大奖)
DC先生研发Hadoop,其灵感来源于Google发表的两篇论文。GFS是Google最初使用的分布式文件系统。MapReduce最早是由Google研究提出的一种面向大规模数据处理的并行计算模型和方法,其初衷主要是为了解决搜索引擎中大规模网页数据的并行化处理。由于MapReduce可以普遍应用于很多大规模数据的计算问题,Google进一步将其广泛应用于很多大规模数据处理问题。到目前为止,Google有上万个各种不同的算法问题和程序都使用Ma