Jsoup-Element

类元素

org.jsoup.nodes.Element

所有已实现的接口:

Cloneable

直接已知子类:

DocumentFormElementPseudoTextElement


公共类 元素
扩展了 Node
HTML元素由标记名称,属性和子节点(包括文本节点和其他元素)组成。您可以从Element中提取数据,遍历节点图并处理HTML。

 

  • 构造器摘要

     
    建设者
    描述
    Element ( String  tag)
    创建一个新的独立元素。
    Element ( Tag  tag,  String  baseUri)
    从标签和基本URI创建一个新元素。
    Element ( Tag  tag,  String  baseUri,  Attributes  attributes)
    创建一个新的独立元素。
     
  • 方法总结

     
    修饰符和类型
    方法
    描述
    addClass ( String  className)
    在该元素的 class 属性中添加一个类名。
    after ( String  html)
    将指定的HTML插入到此元素之后的DOM中(如下所示)。
    after ( Node  node)
    将指定的节点插入到该节点之后的DOM中(作为后续的同级节点)。
    append ( String  html)
    向此元素添加内部HTML。
    appendChild ( Node  child)
    在此Element的子元素的末尾插入一个节点。
    appendChildren ( Collection <? extends  Node > children)
    将给定的节点插入此Element的子元素的末尾。
    appendElement ( String  tagName)
    通过标签名称创建一个新元素,并将其添加为最后一个子元素。
    appendText ( String  text)
    创建一个新的TextNode并将其附加到此元素。
    appendTo ( Element  parent)
    将此元素添加到提供的父元素中,作为其下一个子元素。
    attr ( String  attributeKey, boolean attributeValue)
    在此元素上设置布尔属性值。
    attr ( String  attributeKey,  String  attributeValue)
    在此元素上设置属性值。
    获取所有元素的属性。
    baseUri ()
    获取适用于此节点的基本URI。
    before ( String  html)
    将指定的HTML插入DOM到此元素之前(作为之前的同级元素)。
    before ( Node  node)
    将指定的节点插入到该节点之前的DOM中(作为先前的同级节点)。
    child (int index)
    通过从0开始的索引号获取此元素的子元素。
    int
    获取此节点拥有的子节点数。
    获取此元素的子元素。
    int
    获取作为元素的该元素的子节点数。
    获取此元素的“ class”属性的文字值,其中可能包含多个类名,以空格分隔。
    Set < String >
    获取所有元素的类名。
    classNames ( Set < String > classNames)
    将元素的 class 属性设置为提供的类名称。
    清除(删除)此节点中的所有属性。
    clone ()
    创建该节点及其所有子节点的独立的深层副本。
    closest ( String  cssQuery)
    在与指定的CSS查询匹配的父级树中找到最接近的元素。
    closest ( Evaluator  evaluator)
    在与指定评估者匹配的父级树中找到最接近的元素。
    获取将唯一选择此元素的CSS选择器。
    data ()
    获取此元素的组合数据。
    获取此元素的子数据节点。
    Map < String , String >
    dataset ()
    获取此元素的HTML5自定义数据属性。
    protected  Element
    doClone ( Node  parent)
     
    protected void
    doSetBaseUri ( String  baseUri)
    如果此节点跟踪基本URI,则仅为此节点(而不是其后代)设置baseUri。
    int
    获取此元素在其元素同级列表中的列表索引。
    empty ()
    删除元素的所有子节点。
    protected  List < Node >
     
    filter ( NodeFilter  nodeFilter)
    通过此节点及其后代执行深度优先过滤。
    获取此元素的第一个Element兄弟。
    在此元素下找到所有元素(包括自我和孩子的孩子)。
    通过ID查找元素,包括该元素或在该元素下。
    查找具有命名属性集的元素。
    查找具有以提供的前缀开头的属性名称的元素。
    查找具有具有特定值的属性的元素。
    查找具有其值包含匹配字符串的属性的元素。
    getElementsByAttributeValueEnding ( String  key,  String  valueSuffix)
    查找具有以值后缀结尾的属性的元素。
    查找具有其值与提供的正则表达式匹配的属性的元素。
    查找具有其值与提供的正则表达式匹配的属性的元素。
    查找不具有此属性或具有不同值的元素。
    查找具有以值前缀开头的属性的元素。
    getElementsByClass ( String  className)
    查找具有此类的元素,包括该元素或在该元素下。
    查找其兄弟索引等于提供的索引的元素。
    查找兄弟索引大于提供的索引的元素。
    查找兄弟索引小于提供的索引的元素。
    getElementsByTag ( String  tagName)
    查找具有指定标签名称的元素(包括在该元素下并在此元素下递归)。
    查找直接包含指定字符串的元素。
    查找包含指定字符串的元素。
    查找其自身文本与提供的正则表达式匹配的元素。
    查找其自身文本与提供的正则表达式匹配的元素。
    查找其文本与提供的正则表达式匹配的元素。
    查找其文本与提供的正则表达式匹配的元素。
    protected boolean
    检查此Node是否具有实际的Attributes对象。
    protected boolean
    内部测试,以检查是否已创建节点列表对象。
    boolean
    hasClass ( String  className)
    测试此元素是否具有类。
    boolean
    hasText ()
    测试此元素是否具有任何文本内容(不只是空格)。
    html ()
    检索元素的内部HTML。
    html ( String  html)
    设置此元素的内部HTML。
    <T extends  Appendable >
    T
    html (T appendable)
    将此节点及其子节点写入给定的 Appendable
    id ()
    获取 id 此元素的属性。
    id ( String  id)
    设置 id 此元素的属性。
    insertChildren (int index,  Collection <? extends  Node > children)
    将给定的子节点插入此元素的指定索引处。
    insertChildren (int index,  Node ... children)
    将给定的子节点插入此元素的指定索引处。
    boolean
    is ( String  cssQuery)
    检查此元素是否与给定的 Selector CSS查询匹配。
    boolean
    is ( Evaluator  evaluator)
    检查此元素是否与给定的评估者匹配。
    boolean
    isBlock ()
    测试此元素是否为块级元素。
    获取此元素的最后一个元素同级。
    获取此元素的下一个同级元素。
    获取此元素之后的每个同级元素。
    获取此节点的节点名称。
    获取此元素标签的标准化名称。
    ownText ()
    仅获取此元素拥有的(规范化)文本;无法获得所有子项的合并文本。
    parent ()
    获取此节点的父节点。
    parents ()
    获取此元素的父项和祖先,直到文档根目录为止。
    prepend ( String  html)
    将内部HTML添加到此元素中。
    prependChild ( Node  child)
    在此元素的子元素的开头添加一个节点。
    prependChildren ( Collection <? extends  Node > children)
    将给定的节点插入此Element的子代的开头。
    prependElement ( String  tagName)
    通过标签名称创建一个新元素,并将其添加为第一个子元素。
    prependText ( String  text)
    创建一个新的TextNode并将其添加到此元素之前。
    获取此元素的上一个元素同级。
    获取此元素之前的每个元素同级。
    removeAttr ( String  attributeKey)
    从此节点删除属性。
    removeClass ( String  className)
    从该元素的 class 属性中删除类名称。
    root ()
    获取此节点的根节点;就是它的最高祖先。
    select ( String  cssQuery)
    查找与 Selector CSS查询匹配的元素,并以该元素为起始上下文。
    select ( Evaluator  evaluator)
    查找与提供的评估程序匹配的元素。
    selectFirst ( String  cssQuery)
    查找与 Selector CSS查询匹配的第一个元素,并以该元素为起始上下文。
    selectFirst ( Evaluator  evaluator)
    查找与提供的Evaluator匹配的第一个元素,并以该元素作为起始上下文,或者 null 如果没有匹配项。
    创建该节点的独立的浅表副本。
    获取同级元素。
    Tag
    tag ()
    获取此元素的标签。
    tagName ()
    获取此元素的标签名称。
    tagName ( String  tagName)
    更改(重命名)该元素的标签。
    text ()
    获取此元素及其所有子元素的 规范化组合文本
    text ( String  text)
    设置此元素的文本。
    获取此元素的子文本节点。
    toggleClass ( String  className)
    在该元素的 class 属性上切换类名称:如果存在,请将其删除;否则,将其删除。否则添加它。
    traverse ( NodeVisitor  nodeVisitor)
    在该节点及其后代中进行深度优先遍历。
    val ()
    获取表单元素的值(输入,文本区域等)。
    val ( String  value)
    设置表单元素的值(输入,文本区域等)。
    获取此元素的所有子元素的(未编码)文本,包括原始元素中存在的所有换行符和空格。
    wrap ( String  html)
    将提供的HTML环绕此元素。
     

    从类org.jsoup.nodes继承的方法。节点

    从类java.lang继承的方法。目的

    finalize ,  getClass ,  hashCode ,  notify ,  notifyAll ,  wait ,  wait ,  wait
  • 构造函数详细信息

    • 元素

      公共 元素( 字符串  标签)
      创建一个新的独立元素。

      参数:

      tag - 标签名

    • 元素

      公共 元素( 标签  标签, @Nullable   String   baseUri, @Nullable   Attributes  属性)
      创建一个新的独立元素。(其中的标准版没有父级。)

      参数:

      tag -该元素的标签

      baseUri -基本URI(可选,可以为null以从父级继承,也可以为“”清除父级)

      attributes -初始属性(可选,可以为null)

      也可以看看:

      appendChild(Node), appendElement(String)

    • 元素

      公共 元素( Tag   tag, String   baseUri)
      从标签和基本URI创建一个新元素。

      参数:

      tag -元素标签

      baseUri-此元素的基本URI。可选,并且将从其父级继承(如果有)。

      也可以看看:

      Tag.valueOf(String, ParseSettings)

  • 方法细节

    • hasChildNodes

      受保护的  布尔  hasChildNodes ()
      内部测试,以检查是否已创建节点列表对象。
    • sureChildNodes

      受保护的  列表 < 节点 >   sureChildNodes ()

      指定者:

      ensureChildNodes 在班上 Node

    • hasAttributes

      受保护的  布尔  hasAttributes ()
      从类复制的说明:  Node
      检查此Node是否具有实际的Attributes对象。

      指定者:

      hasAttributes 在班上 Node

    • 属性

      public   Attributes  属性 ()
      从类复制的说明:  Node
      获取所有元素的属性。

      指定者:

      attributes 在班上 Node

      返回值:

      属性(以与原始HTML中相同的顺序实现可迭代)。

    • baseUri

      public   String   baseUri ()
      从类复制的说明:  Node
      获取适用于此节点的基本URI。如果未定义,将返回一个空字符串。用于使相对链接成为绝对链接。

      指定者:

      baseUri 在班上 Node

      返回值:

      基本URI

      也可以看看:

      Node.absUrl(java.lang.String)

    • doSetBaseUri

      受保护的  void   doSetBaseUri String   baseUri)
      从类复制的说明:  Node
      如果此节点跟踪基本URI,则仅为此节点(而不是其后代)设置baseUri。

      指定者:

      doSetBaseUri 在班上 Node

      参数:

      baseUri -新的URI

    • childNodeSize

      public   int   childNodeSize ()
      从类复制的说明:  Node
      获取此节点拥有的子节点数。

      指定者:

      childNodeSize 在班上 Node

      返回值:

      该节点拥有的子节点数。

    • nodeName

      公共  字符串  nodeName ()
      从类复制的说明:  Node
      获取此节点的节点名称。用于调试目的,而不是逻辑切换(为此,请使用instanceof)。

      指定者:

      nodeName 在班上 Node

      返回值:

      节点名称

    • 标签名

      公共  字符串  tagName ()
      获取此元素的标签名称。例如 div 。如果使用 case preserving parsing ,则将返回源的原始大小写。

      返回值:

      标签名称

    • normalName

      公共  字符串  normalName ()
      获取此元素标签的标准化名称。不管解析器是否保留标签大小写,这始终是标签的小写版本。例如, <DIV> <div> 都具有正常名称 div

      返回值:

      正常名称

    • 标签名

      公共  元素  tagName 字符串  tagName)
      更改(重命名)该元素的标签。例如,转换 <span> <div> el.tagName("div");

      参数:

      tagName -此元素的新标签名称

      返回值:

      这个元素,用于链接

      也可以看看:

      Elements.tagName(String)

    • 标签

      公共  标签  标签 ()
      获取此元素的标签。

      返回值:

      标签对象

    • isBlock

      公共  布尔  isBlock ()
      测试此元素是否为块级元素。(例如, <div> == true 或内联元素 <span> == false )。

      返回值:

      如果阻塞,则返回true;否则,则返回false(因此内联)

    • ID

      公共  字符串  ID ()
      获取 id 此元素的属性。

      返回值:

      id属性(如果存在),否则为空字符串。

    • ID

      公共  元素  ID 字符串  ID)
      设置 id 此元素的属性。

      参数:

      id -要使用的ID值

      返回值:

      此元素,用于链接

    • 属性

      公共  元素  属性 String   attributeKey, String   attributeValue)
      在此元素上设置属性值。如果此元素已经具有带有键的属性,则其值将更新;否则,将更新它的值。否则,将添加新属性。

      覆写:

      attr 在班上 Node

      参数:

      attributeKey -属性键。

      attributeValue -属性值。

      返回值:

      这个元素

    • 属性

      公共  元素  属性 String   attributeKey,boolean attributeValue)
      在此元素上设置布尔属性值。设置为 true 将属性值设置为“”,并将属性标记为布尔值,因此不会写出任何值。设置为 false 会删除具有相同键的属性(如果存在)。

      参数:

      attributeKey -属性键

      attributeValue -属性值

      返回值:

      这个元素

    • 资料集

      公共  地图 < 字符串 字符串 >  数据集 ()
      获取此元素的HTML5自定义数据属性。数据集中包含元素中以“ data-”开头的键的每个属性。
      例如,元素 <div data-package="jsoup" data-language="Java" class="group">... 具有数据集 package=jsoup, language=java
      该图是元素属性图的过滤视图。 对一个映射的更改(添加,删除,更新)反映在另一映射中。
      您可以使用 [^data-] 属性键前缀选择器 找到具有数据属性的元素

      返回值:

      key=value自定义数据属性 的映射

    • 父母

      公共最终  元素  父级 ()
      从类复制的说明:  Node
      获取此节点的父节点。

      覆写:

      parent 在班上 Node

      返回值:

      父节点;如果没有父母,则返回null。

      也可以看看:

      Node.hasParent()

    • 父母

      公共  元素的  父母 ()
      获取此元素的父项和祖先,直到文档根目录为止。

      返回值:

      此元素的父级堆栈,最接近的堆栈。

    • 孩子

      public   Element  元素 int索引)
      通过从0开始的索引号获取此元素的子元素。
      请注意,元素可以同时具有混合的Nodes和Elements作为子元素。 此方法检查作为元素的子代的筛选列表,并且索引基于该筛选列表。

      参数:

      index -要检索的元素的索引号

      返回值:

      子元素(如果存在),否则抛出 IndexOutOfBoundsException

      也可以看看:

      Node.childNode(int)

    • 儿童尺寸

      public   int   childrenSize ()
      获取作为元素的该元素的子节点数。
      此方法适用于相同的过滤列表,例如 child(int) 使用 Node.childNodes() childNodeSize() 获取未过滤的节点(例如,包括TextNodes等)

      返回值:

      作为元素的子节点的数量

      也可以看看:

      children(), child(int)

    • 孩子们

      公共  元素的  孩子 ()
      获取此元素的子元素。
      这实际上是 Node.childNodes() 获取元素节点 的过滤器

      返回值:

      子元素。如果此元素没有子元素,则返回一个空列表。

      也可以看看:

      Node.childNodes()

    • textNodes

      公共  列表 <  TextNode  >   textNodes ()
      获取此元素的子文本节点。该列表不可修改,但可以操纵文本节点。
      This is effectively a filter on  Node.childNodes()  to get Text nodes.

      Returns:

      child text nodes. If this element has no text nodes, returns an empty list.For example, with the input HTML: <p>One <span>Two</span> Three <br> Four</p> with the p element selected:

      • p.text()  =  "One Two Three Four"
      • p.ownText()  =  "One Three Four"
      • p.children()  =  Elements[<span>, <br>]
      • p.childNodes()  =  List<Node>["One ", <span>, " Three ", <br>, " Four"]
      • p.textNodes()  =  List<TextNode>["One ", " Three ", " Four"]
    • dataNodes

      public  List < DataNode >  dataNodes ()
      Get this element's child data nodes. The list is unmodifiable but the data nodes may be manipulated.
      This is effectively a filter on  Node.childNodes()  to get Data nodes.

      Returns:

      child data nodes. If this element has no data nodes, returns an empty list.

      See Also:

      data()

    • select

      public  Elements  select ( String  cssQuery)
      Find elements that match the  Selector  CSS query, with this element as the starting context. Matched elements may include this element, or any of its children.
      This method is generally more powerful to use than the DOM-type  getElementBy*  methods, because multiple filters can be combined, e.g.:
      • el.select("a[href]")  - finds links ( a  tags with  href  attributes)
      • el.select("a[href*= example.com ]")  - finds links pointing to example.com (loosely)
      See the query syntax documentation in  Selector .
      Also known as  querySelectorAll()  in the Web DOM.

      Parameters:

      cssQuery - a Selector CSS-like query

      Returns:

      an Elements list containing elements that match the query (empty if none match)

      Throws:

      Selector.SelectorParseException - (unchecked) on an invalid CSS query.

      See Also:

      selector query syntaxQueryParser.parse(String)

    • select

      public  Elements  select ( Evaluator  evaluator)
      Find elements that match the supplied Evaluator. This has the same functionality as  select(String) , but may be useful if you are running the same query many times (on many documents) and want to save the overhead of repeatedly parsing the CSS query.

      Parameters:

      evaluator - an element evaluator

      Returns:

      an Elements list containing elements that match the query (empty if none match)

    • selectFirst

      @Nullable  public  Element  selectFirst ( String  cssQuery)
      查找与 Selector CSS查询匹配的第一个元素,并以该元素为起始上下文。
      这实际上与call相同 element.select(query).first() ,但是由于查询在第一次命中时停止执行,因此效率更高。
      querySelector() 在Web DOM中 也称为

      参数:

      cssQuery-cssQuery类似SelectorCSS的查询

      返回值:

      第一个匹配的元素,或者null如果没有匹配项。

    • selectFirst

      @Nullable  public   Element   selectFirst 评估  者 评估 者)
      查找与提供的Evaluator匹配的第一个元素,并以该元素作为起始上下文,或者 null 如果没有匹配项。

      参数:

      evaluator -元素评估器

      返回值:

      第一个匹配元素(从该元素开始沿着树走),或者null如果没有匹配项。

    • public   boolean  String   cssQuery)
      检查此元素是否与给定的 Selector CSS查询匹配。 matches() 在Web DOM中也称为。

      参数:

      cssQuery-一个SelectorCSS查询

      返回值:

      如果此元素与查询匹配

    • public   boolean  评估  者 评估 者)
      检查此元素是否与给定的评估者匹配。

      参数:

      evaluator -元素评估器

      返回值:

      如果此元素匹配

    • 最近的

      @Nullable  公共  元素  最接近 字符串  cssQuery)
      在与指定的CSS查询匹配的父级树中找到最接近的元素。将返回自己,一个祖先,或者 null 如果没有这样的匹配元素。

      参数:

      cssQuery-一个SelectorCSS查询

      返回值:

      与提供的评估者匹配的最接近的祖先元素(可能是其自身)。null如果找不到。

    • 最近的

      @Nullable  public   Element  最接近的 评估  者 评估 者)
      在与指定评估者匹配的父级树中找到最接近的元素。将返回自己,一个祖先,或者 null 如果没有这样的匹配元素。

      参数:

      evaluator -查询评估器

      返回值:

      与提供的评估者匹配的最接近的祖先元素(可能是其自身)。null如果找不到。

    • appendChild

      public   Element   appendChild Node   child)
      在此Element的子元素的末尾插入一个节点。传入节点将被重新父化。

      参数:

      child -要添加的节点。

      返回值:

      此元素,用于链接

      也可以看看:

      prependChild(Node), insertChildren(int, Collection)

    • appendChildren

      public   Element   appendChildren Collection  <?extends  Node  > children)
      将给定的节点插入此Element的子元素的末尾。

      参数:

      children -要添加的节点

      返回值:

      此元素,用于链接

      也可以看看:

      insertChildren(int, Collection)

    • appendTo

      public   Element   appendTo 元素  父级)
      将此元素添加到提供的父元素中,作为其下一个子元素。

      参数:

      parent -此元素将附加到的元素

      返回值:

      该元素,以便您可以继续修改该元素

    • prependChild

      public   Element   prependChild Node  子 节点
      在此元素的子元素的开头添加一个节点。

      参数:

      child -要添加的节点。

      返回值:

      此元素,以便您可以添加更多的子节点或元素。

    • prependChildren

      public   Element   prependChildren Collection  <?extend  Node  > children)
      将给定的节点插入此Element的子代的开头。

      参数:

      children -要添加的节点

      返回值:

      此元素,用于链接

      也可以看看:

      insertChildren(int, Collection)

    • insertChildren

      public   Element   insertChildren int索引, 集合 <?扩展 Node  >子 节点
      将给定的子节点插入此元素的指定索引处。当前节点将向右移动。插入的节点将从其当前父节点移动。为防止移动,请先复制节点。

      参数:

      index-从0开始的索引,在其处插入子代。指定0在开头,-1末尾 插入

      children -要插入的子节点

      返回值:

      此元素,用于链接。

    • insertChildren

      public   Element   insertChildren int索引, Node  ...子代)
      将给定的子节点插入此元素的指定索引处。当前节点将向右移动。插入的节点将从其当前父节点移动。为防止移动,请先复制节点。

      参数:

      index-从0开始的索引,在其处插入子代。指定0在开头,-1末尾 插入

      children -要插入的子节点

      返回值:

      此元素,用于链接。

    • appendElement

      public   Element   appendElement String   tagName)
      通过标签名称创建一个新元素,并将其添加为最后一个子元素。

      参数:

      tagName-标签的名称(例如div)。

      返回值:

      新元素,以允许您向其中添加内容,例如: parent.appendElement("h1").attr("id", "header").text("Welcome");

    • prependElement

      public   Element   prependElement 字符串  tagName)
      通过标签名称创建一个新元素,并将其添加为第一个子元素。

      参数:

      tagName-标签的名称(例如div)。

      返回值:

      新元素,以允许您向其中添加内容,例如: parent.prependElement("h1").attr("id", "header").text("Welcome");

    • appendText

      public   Element   appendText 字符串  文本)
      创建一个新的TextNode并将其附加到此元素。

      参数:

      text -要添加的未编码文本

      返回值:

      这个元素

    • prependText

      public   Element   prependText 字符串  文本)
      创建一个新的TextNode并将其添加到此元素之前。

      参数:

      text -要添加的未编码文本

      返回值:

      这个元素

    • 附加

      公共  元素  追加 字符串  html)
      向此元素添加内部HTML。将解析提供的HTML,并将每个节点附加到子代的末尾。

      参数:

      html -在现有HTML之后在此元素内添加的HTML

      返回值:

      这个元素

      也可以看看:

      html(String)

    • 前置

      公共  元素  前缀 字符串  html)
      将内部HTML添加到此元素中。所提供的HTML将被解析,并且每个节点都位于该元素的子元素的开头。

      参数:

      html -在现有HTML之前在此元素内添加的HTML

      返回值:

      这个元素

      也可以看看:

      html(String)

    •   之前的 public 元素  字符串  html)
      将指定的HTML插入DOM到此元素之前(作为之前的同级元素)。

      覆写:

      before 在班上 Node

      参数:

      html -要在此元素之前添加的HTML

      返回值:

      这个元素,用于链接

      也可以看看:

      after(String)

    •   Node  节点) 之前的 public 元素 
      将指定的节点插入到该节点之前的DOM中(作为先前的同级节点)。

      覆写:

      before 在班上 Node

      参数:

      node -在此元素之前添加

      返回值:

      此元素,用于链接

      也可以看看:

      after(Node)

    •   后面的 public 元素  字符串  html)
      将指定的HTML插入到此元素之后的DOM中(如下所示)。

      覆写:

      after 在班上 Node

      参数:

      html -在此元素之后添加的HTML

      返回值:

      这个元素,用于链接

      也可以看看:

      before(String)

    •   节点  节点) 之后的 公共 元素 
      将指定的节点插入到该节点之后的DOM中(作为后续的同级节点)。

      覆写:

      after 在班上 Node

      参数:

      node -在此元素之后添加

      返回值:

      这个元素,用于链接

      也可以看看:

      before(Node)

    • 空的

      公共  元素为  ()
      删除元素的所有子节点。所有属性均保持原样。

      指定者:

      empty 在班上 Node

      返回值:

      这个元素

    • 公共  元素  包装 String   html)
      将提供的HTML环绕此元素。

      覆写:

      wrap 在班上 Node

      参数:

      html-包装此元素的HTML,例如<div class="head"></div>可以任意深。

      返回值:

      此元素,用于链接。

    • cssSelector

      公共  字符串  cssSelector ()
      获取将唯一选择此元素的CSS选择器。
      如果该元素具有ID,则返回#id;  否则,返回父CSS选择器(如果有),后跟“>”,然后返回元素的唯一选择器(tag.class.class:nth-child(n))。

      返回值:

      CSS路径,可用于在选择器中检索元素。

    • 兄弟元素

      public   Elements   siblingElements ()
      获取同级元素。如果该元素没有兄弟元素,则返回一个空列表。元素本身不是同级,因此不会包含在返回的列表中。

      返回值:

      兄弟元素

    • nextElementSibling

      @Nullable  公共  元素  nextElementSibling ()
      获取此元素的下一个同级元素。例如,如果a div 包含两个 p s,则 nextElementSibling 第一个 p 为第二个 p
      这类似于 Node.nextSibling() ,但只查找元素

      返回值:

      下一个元素;如果没有下一个元素,则返回null

      也可以看看:

      previousElementSibling()

    • nextElementSiblings

      公共  元素  nextElementSiblings ()
      获取此元素之后的每个同级元素。

      返回值:

      此元素之后的每个元素同级,如果没有下一个同级元素,则为空列表

    • previousElementSibling

      @Nullable  公共  元素  previousElementSibling ()
      获取此元素的上一个元素同级。

      返回值:

      上一个元素;如果没有上一个元素,则返回null

      也可以看看:

      nextElementSibling()

    • previousElementSiblings

      public   Elements   previousElementSiblings ()
      获取此元素之前的每个元素同级。

      返回值:

      以前的元素同级,如果没有,则为空列表。

    • firstElementSibling

      公共  元素  firstElementSibling ()
      获取此元素的第一个Element兄弟。那可能就是这个要素。

      返回值:

      作为元素的第一个兄弟姐妹(又名父级的第一个元素子级)

    • elementSiblingIndex

      public   int   elementSiblingIndex ()
      获取此元素在其元素同级列表中的列表索引。即,如果这是第一个元素同级,则返回0。

      返回值:

      在元素同级列表中的位置

    • lastElementSibling

      公共  元素  lastElementSibling ()
      获取此元素的最后一个元素同级。那可能就是这个要素。

      返回值:

      作为元素的最后一个兄弟姐妹(又名父元素的最后一个元素子元素)

    • getElementsByTag

      public   Elements   getElementsByTag 字符串  tagName)
      查找具有指定标签名称的元素(包括在该元素下并在此元素下递归)。

      参数:

      tagName -要搜索的标签名称(不区分大小写)。

      返回值:

      匹配的不可修改的元素列表。如果此元素与其子元素都不匹配,则将为空。

    • getElementById

      @Nullable  public   Element   getElementById 字符串  ID)
      通过ID查找元素,包括该元素或在该元素下。
      请注意,这会找到从此元素开始的第一个匹配ID。 如果从不同的起点向下搜索,则可以通过ID查找不同的元素。 对于文档中按ID标识的唯一元素,请使用 getElementById(String)

      参数:

      id -要搜索的ID。

      返回值:

      按ID的第一个匹配元素,从此元素开始;如果找不到,则为null。

    • getElementsByClass

      public   Elements   getElementsByClass 字符串  className)
      查找具有此类的元素,包括该元素或在该元素下。不区分大小写。
      元素可以具有多个类(例如 <div class="header round first"> 。此方法检查每个类,因此您可以使用来找到上面的类 el.getElementsByClass("header");

      参数:

      className -要搜索的类的名称。

      返回值:

      具有提供的类名的元素,如果没有则为空

      也可以看看:

      hasClass(String), classNames()

    • getElementsByAttribute

      public   Elements   getElementsByAttribute 字符串  键)
      查找具有命名属性集的元素。不区分大小写。

      参数:

      key -属性名称,例如 href

      返回值:

      具有此属性的元素,如果没有则为空

    • getElementsByAttributeStarting

      public   Elements   getElementsByAttributeStarting 字符串  keyPrefix)
      查找具有以提供的前缀开头的属性名称的元素。使用 data- 发现有HTML5数据集的元素。

      参数:

      keyPrefix -属性的名称前缀,例如 data-

      返回值:

      属性名称以前缀开头的元素,如果没有则为空。

    • getElementsByAttributeValue

      public   Elements   getElementsByAttributeValue 字符串  键, 字符串  值)
      查找具有具有特定值的属性的元素。不区分大小写。

      参数:

      key -属性名称

      value -属性值

      返回值:

      具有此属性的属性具有此值的元素,如果没有则为空

    • getElementsByAttributeValueNot

      public   Elements   getElementsByAttributeValueNot 字符串  键, 字符串  值)
      查找不具有此属性或具有不同值的元素。不区分大小写。

      参数:

      key -属性名称

      value -属性值

      返回值:

      没有匹配属性的元素

    • getElementsByAttributeValueStarting

      public   Elements   getElementsByAttributeValueStarting (( 字符串  键, 字符串  valuePrefix)
      查找具有以值前缀开头的属性的元素。不区分大小写。

      参数:

      key -属性名称

      valuePrefix -属性值的开始

      返回值:

      具有以值前缀开头的属性的元素

    • getElementsByAttributeValueEnding

      public   Elements   getElementsByAttributeValueEnding (( 字符串  键, 字符串  valueSuffix)
      查找具有以值后缀结尾的属性的元素。不区分大小写。

      参数:

      key -属性名称

      valueSuffix -属性值的结尾

      返回值:

      具有以值后缀结尾的属性的元素

    • getElementsByAttributeValueContaining

      public   Elements   getElementsByAttributeValueContaining 字符串  键, 字符串  匹配)
      查找具有其值包含匹配字符串的属性的元素。不区分大小写。

      参数:

      key -属性名称

      match -要搜索的值子字符串

      返回值:

      具有包含此文本的属性的元素

    • getElementsByAttributeValueMatching

      public   Elements   getElementsByAttributeValueMatching 字符串  键, 模式  模式)
      查找具有其值与提供的正则表达式匹配的属性的元素。

      参数:

      key -属性名称

      pattern -编译正则表达式以与属性值匹配

      返回值:

      具有与此正则表达式匹配的属性的元素

    • getElementsByAttributeValueMatching

      public   Elements   getElementsByAttributeValueMatching 字符串  键, 字符串  正则表达式)
      查找具有其值与提供的正则表达式匹配的属性的元素。

      参数:

      key -属性名称

      regex-与属性值匹配的正则表达式。您可以使用嵌入式标志(例如(?i)和(?m)来控制正则表达式选项。

      返回值:

      具有与此正则表达式匹配的属性的元素

    • getElementsByIndexLessThan

      public   Elements   getElementsByIndexLessThan int索引)
      查找兄弟索引小于提供的索引的元素。

      参数:

      index -从0开始的索引

      返回值:

      小于索引的元素

    • getElementsByIndexGreaterThan

      public   Elements   getElementsByIndexGreaterThan int索引)
      查找兄弟索引大于提供的索引的元素。

      参数:

      index -从0开始的索引

      返回值:

      大于索引的元素

    • getElementsByIndexEquals

      public   Elements   getElementsByIndexEquals int索引)
      查找其兄弟索引等于提供的索引的元素。

      参数:

      index -从0开始的索引

      返回值:

      等于索引的元素

    • getElementsContainingText

      public   Elements   getElementsContainingText 字符串  searchText)
      查找包含指定字符串的元素。搜索不区分大小写。文本可以直接出现在元素中,也可以出现在元素的任何后代中。

      参数:

      searchText -在元素的文本中查找

      返回值:

      包含字符串的元素,不区分大小写。

      也可以看看:

      text()

    • getElementsContainingOwnText

      public   Elements   getElementsContainingOwnText 字符串  searchText)
      查找直接包含指定字符串的元素。搜索不区分大小写。文本必须直接出现在元素中,而不是出现在元素的任何后代中。

      参数:

      searchText -在元素自己的文本中查找

      返回值:

      包含字符串的元素,不区分大小写。

      也可以看看:

      ownText()

    • getElementsMatchingText

      public   Elements   getElementsMatchingText 模式  模式)
      查找其文本与提供的正则表达式匹配的元素。

      参数:

      pattern -匹配文本的正则表达式

      返回值:

      匹配提供的正则表达式的元素。

      也可以看看:

      text()

    • getElementsMatchingText

      public   Elements   getElementsMatchingText 字符串  正则表达式)
      查找其文本与提供的正则表达式匹配的元素。

      参数:

      regex-匹配文本的正则表达式。您可以使用嵌入式标志(例如(?i)和(?m)来控制正则表达式选项。

      返回值:

      匹配提供的正则表达式的元素。

      也可以看看:

      text()

    • getElementsMatchingOwnText

      public   Elements   getElementsMatchingOwnText 模式  模式)
      查找其自身文本与提供的正则表达式匹配的元素。

      参数:

      pattern -匹配文本的正则表达式

      返回值:

      匹配提供的正则表达式的元素。

      也可以看看:

      ownText()

    • getElementsMatchingOwnText

      public   Elements   getElementsMatchingOwnText 字符串  正则表达式)
      查找其自身文本与提供的正则表达式匹配的元素。

      参数:

      regex-匹配文本的正则表达式。您可以使用嵌入式标志(例如(?i)和(?m)来控制正则表达式选项。

      返回值:

      匹配提供的正则表达式的元素。

      也可以看看:

      ownText()

    • getAllElements

      公共  元素  getAllElements ()
      在此元素下找到所有元素(包括自我和孩子的孩子)。

      返回值:

      所有要素

    • 文本

      公开  字串  文字 ()
      获取此元素及其所有子元素的 规范化组合文本 。空格被规范化和修剪。
      例如,给定HTML  <p>Hello <b>there</b> now! </p> ,则 p.text() 返回 "Hello there now!"
      如果您不想使用规范化的文本,请使用 wholeText() 如果只需要此节点的文本(而不是子节点),请使用 ownText()
      请注意,此方法返回将呈现给读者的文本内容。 数据节点的内容(例如 <script> 标记不视为文本。使用 data() html() 检索该内容。

      返回值:

      未编码的规范化文本,如果没有则为空字符串。

      也可以看看:

      wholeText()ownText()textNodes()

    • WholeText

      公共  字符串  WholeText ()
      获取此元素的所有子元素的(未编码)文本,包括原始元素中存在的所有换行符和空格。

      返回值:

      未编码,未规范化的文本

      也可以看看:

      text()

    • ownText

      公共  字符串  ownText ()
      仅获取此元素拥有的(规范化)文本;无法获得所有子项的合并文本。
      例如,给定HTML  <p>Hello <b>there</b> now!</p> p.ownText() 返回 "Hello now!" ,而 p.text() return  "Hello there now!" 请注意, b 元素 内的文本 不是元素的直接子元素,因此不会返回 p

      返回值:

      未编码的文本,如果没有则为空字符串。

      也可以看看:

      text(), textNodes()

    • 文本

      公共  元素  文本 字符串  文本)
      设置此元素的文本。任何现有内容(文本或元素)将被清除。
      在特殊情况下,对于 <script> <style> 标记,输入文本将被视为数据,而不是可见文本。

      参数:

      text -未编码的文字

      返回值:

      这个元素

    • hasText

      公共  布尔  hasText ()
      测试此元素是否具有任何文本内容(不只是空格)。

      返回值:

      如果element具有非空白文本内容,则为true。

    • 数据

      公共  字符串  数据 ()
      获取此元素的组合数据。数据例如是 <script> 标签的内部。请注意,数据不是元素的文本。用 text() 得到,这将是用户可见的文字, data() 对剧本,评论,CSS样式等内容

      返回值:

      数据,如果没有则为空字符串

      也可以看看:

      dataNodes()

    • 班级名称

      公共  字符串  className ()
      获取此元素的“ class”属性的文字值,其中可能包含多个类名,以空格分隔。(例如 <div class="header gray"> 退货,“  header gray ”)

      返回值:

      文字类属性,如果未设置类属性,则为空字符串

    • 类名

      公共  Set  <  String  >   classNames ()
      获取所有元素的类名。例如on元素 <div class="header gray"> ,返回两个元素的集合 "header", "gray" 。请注意,对此集合的修改不会推送到backing class 属性。使用该 classNames(java.util.Set) 方法来保留它们。

      返回值:

      一组类名,如果没有类属性,则为空

    • 类名

      公共  元素  classNames Set  <  String  > classNames)
      将元素的 class 属性设置为提供的类名称。

      参数:

      classNames -一组课程

      返回值:

      这个元素,用于链接

    • hasClass

      public   boolean   hasClass String   className)
      测试此元素是否具有类。不区分大小写。

      参数:

      className -要检查的班级名称

      返回值:

      如果是,则为true,否则为false

    • addClass

      public   Element   addClass String   className)
      在该元素的 class 属性中添加一个类名。

      参数:

      className -要添加的类名

      返回值:

      这个元素

    • removeClass

      公共  元素  removeClass 字符串  className)
      从该元素的 class 属性中删除类名称。

      参数:

      className -要删除的类名

      返回值:

      这个元素

    • toggleClass

      公共  元素  toggleClass 字符串  className)
      在该元素的 class 属性上切换类名称:如果存在,请将其删除;否则,将其删除。否则添加它。

      参数:

      className -要切换的类名

      返回值:

      这个元素

    • public   String   val ()
      获取表单元素的值(输入,文本区域等)。

      返回值:

      表单元素的值;如果未设置,则为空字符串。

    • public   Element   val 字符串  值)
      设置表单元素的值(输入,文本区域等)。

      参数:

      value -要设置的值

      返回值:

      此元素(用于链接)

    • html

      公共  字符串  html ()
      检索元素的内部HTML。例如在 <div> 一个空的上 <p> ,会返回 <p></p> 。(而 Node.outerHtml() 返回 <div><p></p></div> 。)

      返回值:

      HTML的字符串。

      也可以看看:

      Node.outerHtml()

    • html

      公共  <T延伸 的append  >   Ť   HTML Ť追加)
      从类复制的说明:  Node
      将此节点及其子节点写入给定的 Appendable

      覆写:

      html 在班上 Node

      参数:

      appendable-Appendable要写的。

      返回值:

      提供的Appendable,用于链接。

    • html

      公共  元素  html 字符串  html)
      设置此元素的内部HTML。首先清除现有的HTML。

      参数:

      html -要解析并设置为该元素的HTML

      返回值:

      这个元素

      也可以看看:

      append(String)

    • 克隆

      公共  元素  克隆 ()
      从类复制的说明:  Node
      创建该节点及其所有子节点的独立的深层副本。克隆的节点将没有兄弟姐妹或父节点。作为独立对象,对克隆或其子代所做的任何更改都不会影响原始节点。
      可以使用将克隆的节点采用到另一个Document或节点结构中 appendChild(Node)

      覆写:

      clone 在班上 Node

      返回值:

      一个独立的克隆节点,包括任何子代的克隆

      也可以看看:

      Node.shallowClone()

    • 浅克隆

      公共  元素  shallowClone ()
      从类复制的说明:  Node
      创建该节点的独立的浅表副本。它的所有子节点(如果有)都不会被克隆,也没有父节点或兄弟节点。

      覆写:

      shallowClone 在班上 Node

      返回值:

      该节点的单个独立副本

      也可以看看:

      Node.clone()

    • doClone

      受保护的  元素  doClone (( Nullable   Node   parent)

      覆写:

      doClone 在班上 Node

    • clearAttributes

      公共  元素  clearAttributes ()
      从类复制的说明:  Node
      清除(删除)此节点中的所有属性。

      覆写:

      clearAttributes 在班上 Node

      返回值:

      这个,用于链接

    • removeAttr

      公共  元素  removeAttr 字符串  attributeKey)
      从类复制的说明:  Node
      从此节点删除属性。

      覆写:

      removeAttr 在班上 Node

      参数:

      attributeKey -要删除的属性。

      返回值:

      这个(用于链接)

    • 公共  元素  ()
      从类复制的说明:  Node
      获取此节点的根节点;就是它的最高祖先。如果此节点是顶级祖先,则返回 this

      覆写:

      root 在班上 Node

      返回值:

      最高祖先。

    • 遍历

      公共  元素  遍历 NodeVisitor   nodeVisitor)
      从类复制的说明:  Node
      在该节点及其后代中进行深度优先遍历。

      覆写:

      traverse 在班上 Node

      参数:

      nodeVisitor -在每个节点上执行的访客回调

      返回值:

      该节点,用于链接

    • 筛选

      公共  元素  过滤器 NodeFilter   nodeFilter)
      从类复制的说明:  Node
      通过此节点及其后代执行深度优先过滤。

      覆写:

      filter 在班上 Node

      参数:

      nodeFilter -在每个节点上执行的过滤器回调

      返回值:

      该节点,用于链接

      使用案例:

      
      
      Document doc = Jsoup.parse(html);
      //评估日期
      Element valuationName = doc.getElementById("table4").getElementsByTag("tr").get(2)
              .getElementsByTag("span").get(0);
      Element valuationTime = doc.getElementById("table4").getElementsByTag("tr").get(2)
              .getElementsByTag("span").get(1);
      map.put(valuationName.text().replaceAll(":",""),valuationTime.text());

      解释:通过id获取改table标签,然后获取该table标签下所有的tr标签,该div所在的tr索引为2取出该tr标签,再获取该tr标签下所有的的span标签,评估日期文字和实际时间所处span标签集的下标为0和1,获取element元素然后获取其值。

       

       

       

       

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值