现在开始对它进行研究和应用,有兴趣的一起討論。
研究目的:
1.海量数据情况下hadoop的继续深入
2.分布式下爬虫和搜索的探索
3.pagerank的实际分析
4.对开源架构的学习
references:
eclipse上布置(是java project而不是web project)
应用心得]nutch1.2 的eclipse windows 集成
Nutch架构
现在开始对它进行研究和应用,有兴趣的一起討論。
研究目的:
1.海量数据情况下hadoop的继续深入
2.分布式下爬虫和搜索的探索
3.pagerank的实际分析
4.对开源架构的学习
references:
eclipse上布置(是java project而不是web project)
应用心得]nutch1.2 的eclipse windows 集成