jsoup使用教程

最新推荐文章于 2023-05-08 22:25:01 发布

谁是我的程序媛？

最新推荐文章于 2023-05-08 22:25:01 发布

阅读量190

点赞数

分类专栏：若依文章标签： java

原文链接：https://blog.csdn.net/justLym/article/details/105715516

版权

若依专栏收录该内容

9 篇文章 6 订阅

订阅专栏

原文链接：https://blog.csdn.net/justLym/article/details/105715516

jsoup是一款Java的html解析工具，主要是对html和xml文件进行解析
在写爬虫的时候，当我们用HttpClient之类的框架，得到目标网页的源码后，需要从网页源码中取得我们想要的内容。就可以使用jsoup轻松获取想要的内容。

获取jsoup的maven方式

<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.11.3</version>
</dependency>

	 String text = "<ul><li>姓名：<b>张三</b></li><li>年龄：23</li><li>性别：<span style=\"color: rgb(0, 255, 0);\">男</span></li></ul><span style=\"color: rgb(0, 255, 0);\">女</span>";
     Document doc = Jsoup.parse(text);
     Elements divs = doc.select("span");
     System.out.println(divs);
     for (Element div : divs) {
         if("女".equals(div.text())){
             System.out.println(1);
         }
     }