jsoup的Document类

随时随地阅读更多技术实战干货,获取项目源码、学习资料,请关注源代码社区公众号(ydmsq666)

一、简介

Document是一个装载html的文档类,它是jsoup一个非常重要的类。类声明:public class Document extends Element 。Document是Node间接子类,而Node实现了可克隆接口Cloneable。Document类层次结构:


二、嵌套类

Document有两个嵌套类:

①public static class Document.OutputSettings

②public static enum Document.QuirksMode 这是一个枚举类

三、构造方法

public Document(String baseUri)  创建一个新的、空的Documen外壳对象
参数:baseUri - base URI of document
四、方法详细

1、public static Document createShell(String baseUri) 创建一个有效的、空的Document对象,适用于添加更多元素进去。

参数:baseUri - base URI of document

2、public Element  head() 得到Document 的头部(head)元素。

3、public Element body() 得到Document 的body部分内容。
4、public String title()  得到Document的标题. 如果没有标题将会返回null
5、public void title(String title)  设置Document的标题。 如果之前没有标题将设置为此标题,如果之前有将用现在的标题进行替换掉。
6、public Element createElement(String tagName)使用tagName 创建一个新的Element 对象。
参数:tagName - element的标签名称(tag name)
7、public Document normalise()   规范化Document 。  返回规范后的 Document 对象
8、public String outerHtml()  返回此节点的外部html。
9、public Element text(String text)  设置文档body部分的内容,之前body部分的任何存在的节点都会被清除掉。
10、public String nodeName()   得到节点的节点名称。主要用于调试目的。
11、public Document clone() 使用深复制进行克隆,即对其所有子元素也进行克隆,创建一个独立的节点。克隆后的节点没有兄弟节点也没有父节点,对克隆节点的任何操作将不会影响原节点。
12、public Document.OutputSettings outputSettings()   得到其内部内OutputSettings 对象。
13、public Document.QuirksMode quirksMode()  得到其内部内的QuirksMode 对象
还有其他继承自Element、Node、Object的方法。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jsoup的`Document`提供了一系列用于选择HTML元素的方法,其中最常用的是`select`方法。该方法接受一个CSS选择器作为参数,并返回一个`Elements`对象,该对象包含所有符合选择器条件的元素。 以下是`Document`中与`select`方法相关的API: 1. `select(String cssSelector)`:根据CSS选择器选择元素,并返回一个`Elements`对象。 例如: ```java Document doc = Jsoup.connect("http://example.com").get(); Elements links = doc.select("a[href]"); ``` 2. `selectFirst(String cssSelector)`:根据CSS选择器选择第一个匹配的元素,并返回一个`Element`对象。 例如: ```java Document doc = Jsoup.connect("http://example.com").get(); Element link = doc.selectFirst("a[href]"); ``` 3. `getElementsByTag(String tagName)`:根据标签名选择元素,并返回一个`Elements`对象。 例如: ```java Document doc = Jsoup.connect("http://example.com").get(); Elements paragraphs = doc.getElementsByTag("p"); ``` 4. `getElementsByClass(String className)`:根据名选择元素,并返回一个`Elements`对象。 例如: ```java Document doc = Jsoup.connect("http://example.com").get(); Elements redElements = doc.getElementsByClass("red"); ``` 5. `getElementById(String id)`:根据ID选择元素,并返回一个`Element`对象。 例如: ```java Document doc = Jsoup.connect("http://example.com").get(); Element logo = doc.getElementById("logo"); ``` 请注意,这只能选择具有ID属性的元素。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值