类元素
所有已实现的接口:
直接已知子类:
Document
,FormElement
,PseudoTextElement
-
方法总结
修饰符和类型方法描述在该元素的 class 属性中添加一个类名。将指定的HTML插入到此元素之后的DOM中(如下所示)。将指定的节点插入到该节点之后的DOM中(作为后续的同级节点)。向此元素添加内部HTML。在此Element的子元素的末尾插入一个节点。将给定的节点插入此Element的子元素的末尾。通过标签名称创建一个新元素,并将其添加为最后一个子元素。创建一个新的TextNode并将其附加到此元素。将此元素添加到提供的父元素中,作为其下一个子元素。在此元素上设置布尔属性值。在此元素上设置属性值。attributes ()获取所有元素的属性。baseUri ()获取适用于此节点的基本URI。将指定的HTML插入DOM到此元素之前(作为之前的同级元素)。将指定的节点插入到该节点之前的DOM中(作为先前的同级节点)。child (int index)通过从0开始的索引号获取此元素的子元素。int获取此节点拥有的子节点数。children ()获取此元素的子元素。intchildrenSize ()获取作为元素的该元素的子节点数。className ()获取此元素的“ class”属性的文字值,其中可能包含多个类名,以空格分隔。classNames ()获取所有元素的类名。将元素的 class 属性设置为提供的类名称。清除(删除)此节点中的所有属性。clone ()创建该节点及其所有子节点的独立的深层副本。在与指定的CSS查询匹配的父级树中找到最接近的元素。在与指定评估者匹配的父级树中找到最接近的元素。cssSelector ()获取将唯一选择此元素的CSS选择器。data ()获取此元素的组合数据。dataNodes ()获取此元素的子数据节点。dataset ()获取此元素的HTML5自定义数据属性。protected Elementprotected void如果此节点跟踪基本URI,则仅为此节点(而不是其后代)设置baseUri。int获取此元素在其元素同级列表中的列表索引。empty ()删除元素的所有子节点。通过此节点及其后代执行深度优先过滤。获取此元素的第一个Element兄弟。在此元素下找到所有元素(包括自我和孩子的孩子)。通过ID查找元素,包括该元素或在该元素下。查找具有命名属性集的元素。查找具有以提供的前缀开头的属性名称的元素。查找具有具有特定值的属性的元素。查找具有其值包含匹配字符串的属性的元素。查找具有以值后缀结尾的属性的元素。查找具有其值与提供的正则表达式匹配的属性的元素。查找具有其值与提供的正则表达式匹配的属性的元素。查找不具有此属性或具有不同值的元素。查找具有以值前缀开头的属性的元素。查找具有此类的元素,包括该元素或在该元素下。getElementsByIndexEquals (int index)查找其兄弟索引等于提供的索引的元素。getElementsByIndexGreaterThan (int index)查找兄弟索引大于提供的索引的元素。getElementsByIndexLessThan (int index)查找兄弟索引小于提供的索引的元素。查找具有指定标签名称的元素(包括在该元素下并在此元素下递归)。查找直接包含指定字符串的元素。查找包含指定字符串的元素。查找其自身文本与提供的正则表达式匹配的元素。查找其自身文本与提供的正则表达式匹配的元素。查找其文本与提供的正则表达式匹配的元素。查找其文本与提供的正则表达式匹配的元素。protected boolean检查此Node是否具有实际的Attributes对象。protected boolean内部测试,以检查是否已创建节点列表对象。boolean测试此元素是否具有类。booleanhasText ()测试此元素是否具有任何文本内容(不只是空格)。html ()检索元素的内部HTML。设置此元素的内部HTML。Thtml (T appendable)id ()获取 id 此元素的属性。设置 id 此元素的属性。将给定的子节点插入此元素的指定索引处。将给定的子节点插入此元素的指定索引处。booleanboolean检查此元素是否与给定的评估者匹配。booleanisBlock ()测试此元素是否为块级元素。获取此元素的最后一个元素同级。获取此元素的下一个同级元素。获取此元素之后的每个同级元素。nodeName ()获取此节点的节点名称。normalName ()获取此元素标签的标准化名称。ownText ()仅获取此元素拥有的(规范化)文本;无法获得所有子项的合并文本。parent ()获取此节点的父节点。parents ()获取此元素的父项和祖先,直到文档根目录为止。将内部HTML添加到此元素中。在此元素的子元素的开头添加一个节点。将给定的节点插入此Element的子代的开头。通过标签名称创建一个新元素,并将其添加为第一个子元素。创建一个新的TextNode并将其添加到此元素之前。获取此元素的上一个元素同级。获取此元素之前的每个元素同级。从此节点删除属性。从该元素的 class 属性中删除类名称。root ()获取此节点的根节点;就是它的最高祖先。查找与提供的评估程序匹配的元素。查找与提供的Evaluator匹配的第一个元素,并以该元素作为起始上下文,或者 null 如果没有匹配项。shallowClone ()创建该节点的独立的浅表副本。获取同级元素。tag ()获取此元素的标签。tagName ()获取此元素的标签名称。更改(重命名)该元素的标签。text ()获取此元素及其所有子元素的 规范化组合文本 。设置此元素的文本。textNodes ()获取此元素的子文本节点。在该元素的 class 属性上切换类名称:如果存在,请将其删除;否则,将其删除。否则添加它。在该节点及其后代中进行深度优先遍历。val ()获取表单元素的值(输入,文本区域等)。设置表单元素的值(输入,文本区域等)。wholeText ()获取此元素的所有子元素的(未编码)文本,包括原始元素中存在的所有换行符和空格。将提供的HTML环绕此元素。从类org.jsoup.nodes继承的方法。节点
absUrl , addChildren , addChildren , attr , childNode , childNodes , childNodesAsArray , childNodesCopy , equals , hasAttr , hasParent , hasSameValue , indent , nextSibling , outerHtml , outerHtml , ownerDocument , parentNode , previousSibling , remove , removeChild , reparentChild , replaceChild , replaceWith , setBaseUri , setParentNode , setSiblingIndex , siblingIndex , siblingNodes , toString , unwrap从类java.lang继承的方法。目的
-
构造函数详细信息
-
元素
创建一个新的独立元素。(其中的标准版没有父级。)参数:
tag -该元素的标签
baseUri -基本URI(可选,可以为null以从父级继承,也可以为“”清除父级)
attributes -初始属性(可选,可以为null)
也可以看看:
-
元素
从标签和基本URI创建一个新元素。参数:
tag -元素标签
baseUri-此元素的基本URI。可选,并且将从其父级继承(如果有)。
也可以看看:
-
方法细节
-
hasChildNodes
受保护的 布尔 hasChildNodes ()内部测试,以检查是否已创建节点列表对象。 -
hasAttributes
受保护的 布尔 hasAttributes ()从类复制的说明: Node检查此Node是否具有实际的Attributes对象。指定者:
hasAttributes
在班上Node
-
doSetBaseUri
从类复制的说明: Node如果此节点跟踪基本URI,则仅为此节点(而不是其后代)设置baseUri。指定者:
doSetBaseUri
在班上Node
参数:
baseUri -新的URI
-
childNodeSize
public int childNodeSize ()从类复制的说明: Node获取此节点拥有的子节点数。指定者:
childNodeSize
在班上Node
返回值:
该节点拥有的子节点数。
-
normalName
获取此元素标签的标准化名称。不管解析器是否保留标签大小写,这始终是标签的小写版本。例如, <DIV> 和 <div> 都具有正常名称 div 。返回值:
正常名称
-
标签名
更改(重命名)该元素的标签。例如,转换 <span> 为 <div> 用 el.tagName("div"); 。参数:
tagName -此元素的新标签名称
返回值:
这个元素,用于链接
也可以看看:
-
isBlock
公共 布尔 isBlock ()测试此元素是否为块级元素。(例如, <div> == true 或内联元素 <span> == false )。返回值:
如果阻塞,则返回true;否则,则返回false(因此内联)
-
孩子
通过从0开始的索引号获取此元素的子元素。请注意,元素可以同时具有混合的Nodes和Elements作为子元素。 此方法检查作为元素的子代的筛选列表,并且索引基于该筛选列表。参数:
index -要检索的元素的索引号
返回值:
子元素(如果存在),否则抛出 IndexOutOfBoundsException
也可以看看:
-
儿童尺寸
public int childrenSize ()获取作为元素的该元素的子节点数。返回值:
作为元素的子节点的数量
也可以看看:
-
孩子们
获取此元素的子元素。返回值:
子元素。如果此元素没有子元素,则返回一个空列表。
也可以看看:
-
textNodes
获取此元素的子文本节点。该列表不可修改,但可以操纵文本节点。Returns:
child text nodes. If this element has no text nodes, returns an empty list.For example, with the input HTML: <p>One <span>Two</span> Three <br> Four</p> with the p element selected:
-
p.text() = "One Two Three Four"
-
p.ownText() = "One Three Four"
-
p.children() = Elements[<span>, <br>]
-
p.childNodes() = List<Node>["One ", <span>, " Three ", <br>, " Four"]
-
p.textNodes() = List<TextNode>["One ", " Three ", " Four"]
-
-
dataNodes
Get this element's child data nodes. The list is unmodifiable but the data nodes may be manipulated.Returns:
child data nodes. If this element has no data nodes, returns an empty list.
See Also:
-
select
Find elements that match the Selector CSS query, with this element as the starting context. Matched elements may include this element, or any of its children.This method is generally more powerful to use than the DOM-type getElementBy* methods, because multiple filters can be combined, e.g.:-
el.select("a[href]") - finds links ( a tags with href attributes)
Also known as querySelectorAll() in the Web DOM.Parameters:
cssQuery - a Selector CSS-like query
Returns:
an Elements list containing elements that match the query (empty if none match)
Throws:
Selector.SelectorParseException
- (unchecked) on an invalid CSS query.See Also:
-
-
select
Find elements that match the supplied Evaluator. This has the same functionality as select(String) , but may be useful if you are running the same query many times (on many documents) and want to save the overhead of repeatedly parsing the CSS query.Parameters:
evaluator - an element evaluator
Returns:
an Elements list containing elements that match the query (empty if none match)
-
appendChild
在此Element的子元素的末尾插入一个节点。传入节点将被重新父化。参数:
child -要添加的节点。
返回值:
此元素,用于链接
也可以看看:
-
appendChildren
将给定的节点插入此Element的子元素的末尾。参数:
children -要添加的节点
返回值:
此元素,用于链接
也可以看看:
-
prependChildren
将给定的节点插入此Element的子代的开头。参数:
children -要添加的节点
返回值:
此元素,用于链接
也可以看看:
-
附加
向此元素添加内部HTML。将解析提供的HTML,并将每个节点附加到子代的末尾。参数:
html -在现有HTML之后在此元素内添加的HTML
返回值:
这个元素
也可以看看:
-
前置
将内部HTML添加到此元素中。所提供的HTML将被解析,并且每个节点都位于该元素的子元素的开头。参数:
html -在现有HTML之前在此元素内添加的HTML
返回值:
这个元素
也可以看看:
-
前
将指定的HTML插入DOM到此元素之前(作为之前的同级元素)。覆写:
参数:
html -要在此元素之前添加的HTML
返回值:
这个元素,用于链接
也可以看看:
-
前
将指定的节点插入到该节点之前的DOM中(作为先前的同级节点)。覆写:
参数:
node -在此元素之前添加
返回值:
此元素,用于链接
也可以看看:
-
后
将指定的HTML插入到此元素之后的DOM中(如下所示)。覆写:
参数:
html -在此元素之后添加的HTML
返回值:
这个元素,用于链接
也可以看看:
-
后
将指定的节点插入到该节点之后的DOM中(作为后续的同级节点)。覆写:
参数:
node -在此元素之后添加
返回值:
这个元素,用于链接
也可以看看:
-
cssSelector
获取将唯一选择此元素的CSS选择器。如果该元素具有ID,则返回#id; 否则,返回父CSS选择器(如果有),后跟“>”,然后返回元素的唯一选择器(tag.class.class:nth-child(n))。返回值:
CSS路径,可用于在选择器中检索元素。
-
兄弟元素
获取同级元素。如果该元素没有兄弟元素,则返回一个空列表。元素本身不是同级,因此不会包含在返回的列表中。返回值:
兄弟元素
-
nextElementSibling
获取此元素的下一个同级元素。例如,如果a div 包含两个 p s,则 nextElementSibling 第一个 p 为第二个 p 。返回值:
下一个元素;如果没有下一个元素,则返回null
也可以看看:
-
nextElementSiblings
获取此元素之后的每个同级元素。返回值:
此元素之后的每个元素同级,如果没有下一个同级元素,则为空列表
-
previousElementSibling
获取此元素的上一个元素同级。返回值:
上一个元素;如果没有上一个元素,则返回null
也可以看看:
-
previousElementSiblings
获取此元素之前的每个元素同级。返回值:
以前的元素同级,如果没有,则为空列表。
-
firstElementSibling
获取此元素的第一个Element兄弟。那可能就是这个要素。返回值:
作为元素的第一个兄弟姐妹(又名父级的第一个元素子级)
-
elementSiblingIndex
public int elementSiblingIndex ()获取此元素在其元素同级列表中的列表索引。即,如果这是第一个元素同级,则返回0。返回值:
在元素同级列表中的位置
-
lastElementSibling
获取此元素的最后一个元素同级。那可能就是这个要素。返回值:
作为元素的最后一个兄弟姐妹(又名父元素的最后一个元素子元素)
-
getElementById
通过ID查找元素,包括该元素或在该元素下。参数:
id -要搜索的ID。
返回值:
按ID的第一个匹配元素,从此元素开始;如果找不到,则为null。
-
getElementsByClass
查找具有此类的元素,包括该元素或在该元素下。不区分大小写。元素可以具有多个类(例如 <div class="header round first"> 。此方法检查每个类,因此您可以使用来找到上面的类 el.getElementsByClass("header"); 。参数:
className -要搜索的类的名称。
返回值:
具有提供的类名的元素,如果没有则为空
也可以看看:
-
getElementsByIndexLessThan
查找兄弟索引小于提供的索引的元素。参数:
index -从0开始的索引
返回值:
小于索引的元素
-
getElementsByIndexGreaterThan
查找兄弟索引大于提供的索引的元素。参数:
index -从0开始的索引
返回值:
大于索引的元素
-
getElementsByIndexEquals
查找其兄弟索引等于提供的索引的元素。参数:
index -从0开始的索引
返回值:
等于索引的元素
-
文本
获取此元素及其所有子元素的 规范化组合文本 。空格被规范化和修剪。例如,给定HTML <p>Hello <b>there</b> now! </p> ,则 p.text() 返回 "Hello there now!"返回值:
未编码的规范化文本,如果没有则为空字符串。
也可以看看:
-
ownText
仅获取此元素拥有的(规范化)文本;无法获得所有子项的合并文本。例如,给定HTML <p>Hello <b>there</b> now!</p> , p.ownText() 返回 "Hello now!" ,而 p.text() return "Hello there now!" 。 请注意, b 元素 内的文本 不是元素的直接子元素,因此不会返回 p 。返回值:
未编码的文本,如果没有则为空字符串。
也可以看看:
-
hasText
公共 布尔 hasText ()测试此元素是否具有任何文本内容(不只是空格)。返回值:
如果element具有非空白文本内容,则为true。
-
数据
返回值:
数据,如果没有则为空字符串
也可以看看:
-
班级名称
获取此元素的“ class”属性的文字值,其中可能包含多个类名,以空格分隔。(例如 <div class="header gray"> 退货,“ header gray ”)返回值:
文字类属性,如果未设置类属性,则为空字符串。
-
类名
获取所有元素的类名。例如on元素 <div class="header gray"> ,返回两个元素的集合 "header", "gray" 。请注意,对此集合的修改不会推送到backing class 属性。使用该 classNames(java.util.Set) 方法来保留它们。返回值:
一组类名,如果没有类属性,则为空
-
hasClass
测试此元素是否具有类。不区分大小写。参数:
className -要检查的班级名称
返回值:
如果是,则为true,否则为false
-
html
返回值:
HTML的字符串。
也可以看看:
-
html
设置此元素的内部HTML。首先清除现有的HTML。参数:
html -要解析并设置为该元素的HTML
返回值:
这个元素
也可以看看:
-
克隆
从类复制的说明: Node创建该节点及其所有子节点的独立的深层副本。克隆的节点将没有兄弟姐妹或父节点。作为独立对象,对克隆或其子代所做的任何更改都不会影响原始节点。覆写:
返回值:
一个独立的克隆节点,包括任何子代的克隆
也可以看看:
-
浅克隆
从类复制的说明: Node创建该节点的独立的浅表副本。它的所有子节点(如果有)都不会被克隆,也没有父节点或兄弟节点。覆写:
shallowClone
在班上Node
返回值:
该节点的单个独立副本
也可以看看:
-
筛选
从类复制的说明: Node通过此节点及其后代执行深度优先过滤。覆写:
参数:
nodeFilter -在每个节点上执行的过滤器回调
返回值:
该节点,用于链接
使用案例:
Document doc = Jsoup.parse(html); //评估日期 Element valuationName = doc.getElementById("table4").getElementsByTag("tr").get(2) .getElementsByTag("span").get(0);
Element valuationTime = doc.getElementById("table4").getElementsByTag("tr").get(2) .getElementsByTag("span").get(1); map.put(valuationName.text().replaceAll(":",""),valuationTime.text());
解释:通过id获取改table标签,然后获取该table标签下所有的tr标签,该div所在的tr索引为2取出该tr标签,再获取该tr标签下所有的的span标签,评估日期文字和实际时间所处span标签集的下标为0和1,获取element元素然后获取其值。
-