Jsoup-Java爬虫
介绍jsoup
梦星辰.
热爱数学,计算机,经济学,生物学
展开
-
Jsoup 简介与入门
Jsoup简介Jsoup是一个Java的HTML下载和解析工具,相当于Python的爬虫,用好了,基本能实现Python爬虫的功能。Jsoup中,主要操作两个类:Document和Element。Document主要指代对象是网页文档,Element主要指代对象是网页文档中的各个Tag标签抽象出来的节点。Jsoup基本使用过程1.下载网页得到Document对象2.利用Element的方法...原创 2020-01-28 23:21:41 · 767 阅读 · 0 评论 -
Jsoup Cookie登录处理
获取浏览器的cookie打开浏览器(自测谷歌浏览器和火狐浏览器都可以),按下F12打开开发者模式,点击Console打开控制台,键入命令:javascript:alert(document.cookie),回车即可看到浏览器在当前网站的缓存使用下面函数即可将获取到的cookie转化为键值对形式,以用在jsoup中 public HashMap<String, String> co...原创 2020-01-28 22:50:10 · 4699 阅读 · 0 评论 -
Jsoup Document的获取
从字符串获取String html = "<html><head><title>Java爬虫</title></head>" + "<body>内容部分</body></html>";Document doc = Jsoup.parse(html);从网址简单获取Document do...原创 2020-01-28 21:43:18 · 901 阅读 · 0 评论 -
Jsoup Element和Document常用方法
Document类常用方法Element document.body()Element document.head()String document.title()Elements element.children()Element document.getElementById("id")Elements document.getElementsByAttributeValue("k...原创 2020-01-28 21:27:14 · 1006 阅读 · 0 评论