一晃眼, 一个月又过去了, 组里没进行任何关于我毕业论文的工作, 我自己不能再浪费时间, 我必须自己去完成我要研究的东西, 我不能等待了, 我要计划一下我的任务.
要实现我开题的想法,大概有4点,这4点要一个一个去完成,要攻破的难关也非常多,因为hadoop本身是十分庞而且复杂的东西,我主要有4个计划:一个月完成一个计划,估计暑假前就做完。
1、如何实现hadoop数据的最大化的本地化和阻塞式的任务执行。
2、任务中如何实现数据直传。
3、任务间如何实现数据直传。
4、实现上面以后的错误恢复机制。
以上只是一个计划,如果后2个做不完,我就放弃留给下界的学弟做吧。从现在开始干活,第一件事就是搞清楚一个作业到底有哪些东西。干活!!!!