- 博客(3)
- 资源 (5)
- 收藏
- 关注
原创 scrapy(一)之初探爬虫
本文主要通过一个爬虫实例来对scrapy的整个框架的开发流程,scrapy框架的整体运行机制有个比较清晰的认识,以便于下面进一步学习。 我将通过一个论坛的版面抓取帖子的作者的昵称和头像信息,并通过mysql存储,如
2016-07-26 23:32:20 1430
原创 JSoup解析html常见问题
之前写了一个关于抓所以取某个网站用户信息的程序,大量的用到了关于JSoup解析html的知识。并且其中也遇到了一些问题,这类问题在我们以后的开发过程中可能还有机会遇到,所以今天在这里对这块做个总结。一.Jsoup如何根据url获得对应的网页Document文档1.常见写法 doc=Jsoup.parse(new URL(url),4000);//参数2是连接超时设置,一旦超时
2016-07-13 09:50:47 2604
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人