- 博客(51)
- 收藏
- 关注
转载 软件工程
百年Coding小组成员简介:PM 贾伟博客地址:http://www.cnblogs.com/coolcrow/程序开发人员:吴翰雄博客地址:http://www.cnblogs.com/metalcrash/邓嘉博客地址:http://www.cnblogs.com/freestyle-sn/潘学博客地址:http://www.cnblogs...
2013-01-07 12:05:00 255
转载 M2阶段项目Postmortem
1.我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描述?解决目标网页爬取的问题,目标网页为Pipeline需要的网页,定义清楚。有清晰的描述。应用场景也有清晰的定义。2.是否有充足的时间来做计划?有时间,做了比较充足的计划。3.团队在计划阶段是如何解决同事们对于计划的不同意见的?对于不同的意见,团队随时召开小型讨论会,迅速解决分歧,...
2013-01-07 11:15:00 392
转载 基于htmlparser实现网页内容解析
网页解析,即程序自动分析网页内容、获取信息,从而进一步处理信息。网页解析是实现网络爬虫中不可缺少而且十分重要的一环,由于本人经验也很有限,我仅就我们团队开发基于关键词匹配和模板匹配的主题爬虫的经验谈谈如何实现网页解析。首先,必须说在最前的是我们使用的工具——htmlparser简要地说,htmlparser包提供方便、简洁的处理html文件的方法,它将html页面中的标签按树...
2012-12-15 14:54:00 503
转载 代码复审结果
我们进行的是对76er的代码进行审核。代码问题和优点有以下几点:1、有无用类,在整个工程中Url类,没有被用到,所以是一个无用的类,存在于代码中。public class Url { // 原始url的值,主机部分是域名 private String oriUrl; // url的值,主机部分是IP private String u...
2012-12-13 09:49:00 211
转载 团队阅读——怎样学习软件工程
看到这个题目,我首先想到的是邹老师对于软件工程教学负责的态度和践行的方法。邹老师在课堂上跟同学们的互动一直就非常高,对同学们项目工程的进展都给予了十分详的关注。现在相当于做个调查,让我们从受教育者的角度,谈一谈对软件工程教育中的看法。首先我们阅读了给出的几篇关于软工教学的材料:一个是软件工程不等于计算机科学(http://blog.sina.com.cn/s/blog_553f3...
2012-12-12 11:23:00 153
转载 scrum 12.10
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/11/2812263.html
2012-12-11 01:00:00 141
转载 用户项目测试报告
1、作为爬虫组我们交出了爬虫的第一个版本。在这个版本里,爬虫的功能加强了,只会下载网页和PDF,和pipeline小组的需求相对应上,还会往数据库中存入网页的信息,这样做的好处是可以大大的增加爬虫的效率。下面是操作界面:第一个是URL的种子地址,就是要爬取的网页地址。第二栏是要下载的网页数。第三栏是爬虫的线程数接着几个按钮,一个是开始,一个 是重置,一个是退出...
2012-12-09 23:27:00 180
转载 scrum 12.8
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/08/2809229.html
2012-12-08 20:58:00 122
转载 scrum 12.7
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/07/2808134.html
2012-12-07 23:30:00 140
转载 scrum 12.6
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/06/2806312.html
2012-12-06 22:55:00 111
转载 scrum 12.5
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/05/2804213.html
2012-12-05 23:53:00 133
转载 scrum 12.4
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/04/2802323.html
2012-12-04 23:21:00 124
转载 HTML5的网页如何判断?
HTML5草案的前身名为 Web Applications 1.0。於 2004 年被 WHATWG 提出,於 2007 年被 W3C 接纳,并成立了新的 HTML 工作团队。2008年 1 月 22 日,W3C 发布了最新的 HTML5 工作草案,HTML 工作组包括 AOL、Apple、Google、IBM、 Microsoft、Mozilla、Nokia、Opera 等数百个开发上...
2012-12-04 22:55:00 333
转载 scrum 12、3
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/03/2800606.html
2012-12-03 23:48:00 118
转载 scrum 12.2
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/02/2798610.html
2012-12-02 20:31:00 105
转载 scrum 12.1
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/02/2797841.html
2012-12-02 00:00:00 126
转载 scrum 11.30
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/12/01/2796971.html
2012-12-01 00:54:00 97
转载 scrum 11.29
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/29/2795535.html
2012-11-29 23:33:00 107
转载 scrum 11.28
今天任务:明天任务:转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/28/2793860.html
2012-11-28 23:49:00 104
转载 scrum 11.27
今天的任务:明天的任务:燃尽图和燃速:转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/27/2791802.html
2012-11-27 23:42:00 126
转载 团队转会人员情况
百年coding 转出 由之望 到 www从DOOM 转入 潘学转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/20/2778996.html
2012-11-20 14:33:00 113
转载 百年Coding事后诸葛亮会议
设想和目标1.我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描述?解决目标网页爬取的问题,定义的比较清楚。有较为清晰的描述。2.是否有充足的时间来做计划?有时间,做了比较充足的计划。3.团队在计划阶段是如何解决同事们对于计划的不同意见的?对于不同的意见,团队随时召开小型讨论会,迅速解决分歧,保证计划的制定。计划1....
2012-11-19 12:23:00 244
转载 爬虫1.0测试报告
1、单元测试模块类输入预期实际分析网页分析一个包含若干链接的网页将页面上的URL作初步筛选过滤后提取出来网页上的URL都被提取出来放在队列中模块功能正常队列-队列里的URL项有序进入下载无异常...
2012-11-19 08:34:00 499
转载 测试计划
测试主要分两部分:1、单元测试对每一模块给若干简单样例输入,观察输出结果判断模块功能是否正常模块类预期页面分析对给定的网页进行分析,筛选过滤提取出URL队列上步URL存放于队列中并有序访问下载根据队列中的地址下载文件分类把下载到的内容按格式分类存放在指定文件夹线程URL数量庞大时分...
2012-11-19 08:15:00 107
转载 scrum 11.15
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/15/2772525.html
2012-11-15 23:59:00 135
转载 scrum 11.14
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/14/2770790.html
2012-11-14 23:31:00 91
转载 软件开发的轻与重
重意味着严谨、繁琐,轻则意味着迅捷、零散。应当轻还是重?这是个问题通过这次的阅读任务,我想从这两个方面谈软件工程的轻与重:开发流程模式 与 开发团队模式开发流程模式的轻与重:Managing the development of large software systems: concepts and techniques理想的瀑布模型:系统需求——>软件需求—...
2012-11-14 11:35:00 210
转载 scrum 11.13
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/14/2769049.html
2012-11-14 00:02:00 90
转载 scrum 11.12
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/13/2767313.html
2012-11-13 00:01:00 99
转载 scrum 11.11
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/12/2765679.html
2012-11-12 00:12:00 92
转载 scrum 11.10
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/10/2764594.html
2012-11-10 23:46:00 97
转载 scrum 11.9
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/10/2763534.html
2012-11-10 00:13:00 93
转载 scrum 11.8
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/08/2761690.html
2012-11-08 23:26:00 95
转载 scrum 11.7
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/07/2759594.html
2012-11-07 23:01:00 84
转载 scrum 11.6
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/07/2758015.html
2012-11-07 00:13:00 86
转载 crawler technical spec
爬虫技术文档一、爬虫的运行效果首先爬虫工作时要对初始爬取的URL进行输入,点击开始后爬虫开始进行爬取工作。当爬虫将线程全部爬完,并且将要爬取的队列为空时,爬虫停止工作。当然也可以人为停止爬虫的工作。只需要点击停止按钮。爬取时,爬虫界面显示:当前开的线程数,工作的线程数,爬取过的URL地址。下载的各个类的文件数量,和网页数。爬虫爬取到的数据文件都放到一个固定的地址。...
2012-11-06 12:57:00 114
转载 scrum 11.5
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/06/2756244.html
2012-11-06 01:00:00 100
转载 scrum 11.1
转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/11/01/2750511.html
2012-11-01 23:43:00 76
转载 scrum 10.30
燃尽图:转载于:https://www.cnblogs.com/coding-hundredOfYears/archive/2012/10/31/2748939.html
2012-10-31 23:45:00 109
转载 android 4.04的应用程序启动过程及与Zygote的交互(基于静态源码分析)
话不多说我们直接切入主题。关于android,我们都知道的是应用程序是由activity构成的。而一个应用程序的具体启动过程,很少有人关心过,下面我们就对一个应用程序的启动过程开始分析。 在android中,应用程序的入口是ActivityThead中的main函数。 activity 的startActivity最终是在ActivityManagerService中调用...
2012-10-28 23:51:00 107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人