Java 爬虫Jsoup解析

最新推荐文章于 2020-03-23 20:24:00 发布

__1234

最新推荐文章于 2020-03-23 20:24:00 发布

阅读量221

点赞数

分类专栏：爬虫文章标签： Jsoup java 爬虫

本文链接：https://blog.csdn.net/qq_40550973/article/details/81843497

版权

1 篇文章 0 订阅

订阅专栏

引包：

<dependency>
        <groupId>org.jsoup</groupId>
        <artifactId>jsoup</artifactId>
        <version>1.11.2</version>
    </dependency>

连接：

String string="http://www/***";
Connection connect = Jsoup.connect(string);

得到网页代码：

Document document = connect.get();

开始解析：

getElementsByClass() 通过Class属性来定位元素，获取的是所有带这个class属性的集合

getElementsByTag(); 通过标签名字来定位元素，获取的是所有带有这个标签名字的元素结合

getElementById(); 通过标签的ID来定位元素，这个是精准定位，因为页面的ID基本不会重复

以上是常用的三个方法

比如：

Elements body = document.getElementsByTag("body");

再比如：

String name = element1.getElementsByClass("item-value").eachText().get(0);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注