BlogDigger开发计划
人员:raywill,issac,blueSnail,ajim,geoffry,s
阶段:1.数据预处理阶段,2.分类器设计阶段,3.组装测试阶段,4.Web整合阶段
1.数据预处理阶段
要求:定义一套完整的数据表示标准,标准中要包含完整的对象信息,如字体·大小·内容·地址等等,为分类器处理数据和“窗口密度分析”打下基础。
2.分类器设计阶段
要求:通过一定数量页面的学习,能够准确地将目标分类,为提取目标提供一套完整的解决方案。
包含两个子阶段:
2.1 内容分析
2.2 N邻域分析
3.组装测试阶段
4.Web整合阶段
要求:
每个阶段都要有完备的文档记录,特别要记录下在设计过程中参考了那些文档,尊重第一作者。
完成任务固然重要,更重要的是每个人在完成任务的过程中能学习到新的知识,同时有所创新。
初级目标:
在本领域中达到90%的正确率。
最终目标:
任意领域适用,成为一个信息整合中心。