自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 网络采集器Demo:Jsoup+Java多线程实现[爬虫](下)

ailab-mltk:http://blog.csdn.net/qdhy199148/article/details/49403585 下半部分主要是介绍Java的多线程编程。 我们得到了所有的有效链接和获取各个链接页面有效内容的方法,帮助大家回忆一下: 1.public Set filterUrl(String seedUrl)2.public String getParagraphCon

2015-11-14 20:53:19 2704 1

原创 网络采集器Demo:Jsoup+Java多线程实现[爬虫](上)

ailab-mltk:http://blog.csdn.net/qdhy199148/article/details/49403585 里面最简单,但是很常用的一个部分,就是网络爬虫,从网页上获取文本信息 这里用到两个工具,一个就是Java多线程(基于Java5 以上的线程池模式,区别于过时的Runable),另外一个是一个小工具:Jsoup,用于解析html网页,获取其中的内容,关于Jsou

2015-11-01 00:01:47 4999 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除