- 博客(2)
- 收藏
- 关注
原创 网络采集器Demo:Jsoup+Java多线程实现[爬虫](下)
ailab-mltk:http://blog.csdn.net/qdhy199148/article/details/49403585 下半部分主要是介绍Java的多线程编程。 我们得到了所有的有效链接和获取各个链接页面有效内容的方法,帮助大家回忆一下: 1.public Set filterUrl(String seedUrl)2.public String getParagraphCon
2015-11-14 20:53:19 2704 1
原创 网络采集器Demo:Jsoup+Java多线程实现[爬虫](上)
ailab-mltk:http://blog.csdn.net/qdhy199148/article/details/49403585 里面最简单,但是很常用的一个部分,就是网络爬虫,从网页上获取文本信息 这里用到两个工具,一个就是Java多线程(基于Java5 以上的线程池模式,区别于过时的Runable),另外一个是一个小工具:Jsoup,用于解析html网页,获取其中的内容,关于Jsou
2015-11-01 00:01:47 4999 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人