Hadoop的历史:
1.Apache Lucene
》全球第一个开源的全文检索引擎工具包
》完整的查询引擎和索引引擎
》部分文本分析引擎
》开发人员可在此基础建立起完整的全文检索引擎
2.Nutch
》开源的的基于Lucene的网页搜索引擎
》加入网页抓取、解析等功能
》类似于Google等商业搜索引擎
Google的两篇重要论文:
》Google File System
》MapReduce架构:Simplified Data Processing on Large Clusters
Hadoop官网:http://hadoop.apache.org
1.Apache Lucene
》全球第一个开源的全文检索引擎工具包
》完整的查询引擎和索引引擎
》部分文本分析引擎
》开发人员可在此基础建立起完整的全文检索引擎
2.Nutch
》开源的的基于Lucene的网页搜索引擎
》加入网页抓取、解析等功能
》类似于Google等商业搜索引擎
Google的两篇重要论文:
》Google File System
》MapReduce架构:Simplified Data Processing on Large Clusters
Hadoop官网:http://hadoop.apache.org