JSOUP学习总结

一、简介

通过解析url 获得html页面(静态页面),解析页面后可以获取页面DOM获取页面信息

二、步骤

步骤:
 解析URl获取Document
 通过解析Document获取(Element或者Elements)  可以再进一步解析(Element或者Elements)来获取到最终的目标(Element或者Elements)

三、解析URL

              (url,超时时间)
  Jsoup.parse(new URL(),xx)
  返回Document对象

四、标签页面解析

1、获取DOM(获取标签 类似js选定)

 
   根据标签获取
                返回值是Elements
          Elements elements= document.getElementsByTag("a");
   根据Class获取
             返回值是 Elements
             Elements elements= document.getElementsByClass("sc_adv_hatr");
   根据id获取
             反返回值是Element
         Element element= document.getElementById("head_wr"); //获取元素
根据标签属性获取
        获取标签中具有 某个属性的元素
             Elements elements= document.getElementsByAttribute("data-log");
        根据标签属性和属性值来获取
             Elements elements=  document.getElementsByAttributeValue("data-log","{'type':'mycollect'}");
通过选择器获取元素(选定元素标签,类似CSS选定)
 *  Element或Elements数据
 *      Elements 是Element的数组形式
 *    标签查找  div
 *          返回值都是Elements
 *              element.select("div")
 *              elements.select("div");
 *
 *     通过id查找  #xx
 *          通过 #xx 匹配id 返回值都是Elements
 *          Elements s= elements.select("#lb");
 *          Elements s2= element.select("#lb");
 *
 *     通过类名查找  .xx
 *          Elements elements1=  elements.select(".dl_item");
 *
 *      通过标签属性查找  [xx]
 *           Elements elements1=   elements.select("[target]");
 *
 *      利用属性和值查找
 *           Elements elements1=   elements.select("[href=/]");
 *
 *
 *      支持多次查找
 *          Elements elements1=   elements.select("[target]").select("div");

2、获取DOM数据

*从获取到的元素中提取数据(获取标签数据)
 * Element数据
 *  获取id(标签的id名字)
 *      element.id() //返回值为String
 *
 *  获取class属性(标签的类选择器名字)
 *      element.className() //返回值为String
 *
 *   根据属性名字获取属性值(标签的属性值,当前标签的任意属性值都可以获取)
 *      element.attr("data-click") //返回值为String
 *
 *   获取全部属性
 *      Attributes attribute= document.attributes(); //返回值Attributes
 *
 *   获取文字内容
 *      标签内容出现的文字
 *    element.text(); //获取标签中的文字内容 (按出现顺序获取) 返回值为string

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值