爬虫
@逐影随行
个人博客:http://hxj1991.com
展开
-
【爬虫系列】第二部分 网页解析Jsoup
Jsoup是一款Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 在爬虫采集网页领域主要作用是用HttpClient获取到网页后,使用Jsoup提取网页中需要的信息,Jsoup支持类似Jquery、CSS选择器,来获取需要的数据,使用非常方便。原创 2017-11-23 15:37:44 · 268 阅读 · 0 评论 -
【网页爬虫】第一部分 网页请求HttpClient
爬虫系列博客将从以下几个方面介绍相对编写网页爬虫核心过程。 【网页爬虫】第一部分 网页请求HttpClient 【爬虫系列】第二部分 网页解析Jsoup 【爬虫系列】第三部分 多线程爬虫框架 【爬虫系列】第四部分 爬虫日志记录 【爬虫系列】第五部原创 2017-11-23 11:39:53 · 410 阅读 · 0 评论