- 博客(3)
- 收藏
- 关注
转载 D
从搬到嘉定起,我突然深刻体会了鲁迅曾经的一篇文章。大致是这样的:对于统治者,你想开窗的时候,记得,不能闹着要开窗,要吵着闹着去掀屋顶。这样,当你说:“不掀屋顶也行,那就开窗吧。”统治者可能还会反过来说你明理。只有这样才能达到本来预期的目的。会想到这段文章,是因为觉得从“可以乘坐教师班车”——“3元的班车”——
2006-04-10 13:19:00 667
原创 又一个周过去了
今天是周日,这个周不知道忙了什么,反正是一直的忙,忙者看Semantic Web , Ontology...........还有那个网站,同时还有XML构建新的网页,RSS感觉东西太杂。呵呵,上周开会时候,导师还说,理不清就对了,无论如何51前要把这些东西理清。同时,祝我的宝贝快乐。
2006-04-09 17:27:00 626
转载 网页数据采集系统
摘要: 本文档详细介绍了网页数据采集系统的架构和运行机理。 第一章简单介绍了Spider的设计意图和模块构成。 第二章简单介绍了Spider.Crawler层如何抓取网页并落地。 第三章简单介绍了Spider.Parser层如何解析落地网页,并生成数据XML文件。 第四章简单介绍了Spider.Saver层如何解析落地XML文件,并生成SQL语句,同时插入数据库记录。
2006-04-06 15:14:00 2060
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人