(1)学习了基本的hadoop源码分析,对hadoop的内部结构有了一定的了解,但不深入
(2)阅读了两篇Introduction to Nutch,对Nutch的基本结构和实现有了一定的了解,下一步将对这两篇文章进行详细阅读和提炼
明天
(1)提炼两篇文章
(2)继续提炼pro hadoop中HDFS章节的内容
后天
(1)提炼mapreduce章节的内容
(2)寻找其他的开源爬虫
(2)阅读了两篇Introduction to Nutch,对Nutch的基本结构和实现有了一定的了解,下一步将对这两篇文章进行详细阅读和提炼
明天
(1)提炼两篇文章
(2)继续提炼pro hadoop中HDFS章节的内容
后天
(1)提炼mapreduce章节的内容
(2)寻找其他的开源爬虫