Java
文章平均质量分 86
iteye_20065
这个作者很懒,什么都没留下…
展开
-
网络蜘蛛基本原理
网络蜘蛛基本原理 关键字: 网络蜘蛛 爬虫 spider 网络蜘蛛即WebSpider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网...原创 2009-03-12 21:31:54 · 317 阅读 · 0 评论 -
Spring的jar包解析
Spring的jar包解析关键字: spring的jar包解析 摘自: http://heilwolf.iteye.com/blog/171387下载的spring包中文件及各种包众多,在项目中往往只有部分是我们必须的,如果不清楚什么时候需要什么包的话,看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是...原创 2008-10-19 15:47:24 · 87 阅读 · 0 评论 -
Heritrix1.14.1在Eclipse下的配置总结
今天终于把Heritrix启动起来了,在此做些总结。 很长时间就想试试这个强大的爬虫了,但是经过多次在命令行里按照网上的各位大侠的方法都失败,不知道为什么,今天还试了一下1.12.1和1.14.1两个版本的,都是提示密码文件的要设成单用户并只读,我已经如此设置了安全标签,但仍不能解决问题,所以决定在Eclipse里面试一下,多次失败后,终于成功启动了Heritrix! ...2008-11-05 16:36:12 · 113 阅读 · 0 评论 -
Heritrix1.14.1在Eclipse下的配置总结(续)
前面做了一个Heritrix1.14.1在Eclipse下的配置总结,那种配置方法虽然可以在Eclipse把Heritrix运行起来,但是存在在WUI下建立JOB时,存在“Modules界面不能改变选择项”的问题。 因此又试了一下,如果能够按以下方法配置,即可正常启动,并且不再发生上面提到的问题。简要说明如下: 1、下载heritrix-1.14.1-src.zip和heritrix-1....2008-12-01 19:50:34 · 111 阅读 · 0 评论