Hadoop之父Doug Cutting
Apache Lucene
1、全球第一个开源的全文搜索引擎工具包
2、完整的查询引擎和索引引擎
3、部分文本分析引擎
4、开发人员可以在此基础上建立起完整的全文检索引擎
Nutch
1、开源的基于Lucene的网页搜索引擎
2、加入了网页抓取、解析等功能
3、类似于Google等商业搜索引擎
Google的两篇重要论文
Google File System
MapReduce:Simplified Data Proocessing on Large Clusters
Hadoop官网:http://hadoop.apache.org/
Hadoop大事记