Android+jsoup爬虫图片+列表

最新推荐文章于 2021-05-27 01:52:52 发布

yzyu

最新推荐文章于 2021-05-27 01:52:52 发布

阅读量333

点赞数

分类专栏：学习笔记文章标签：安卓爬虫 java

本文链接：https://blog.csdn.net/weixin_47397647/article/details/111058766

版权

本文介绍了如何在Android应用中结合jsoup进行网页爬虫操作，包括解析HTML、获取元素以及在实际项目中的应用。通过示例展示了引入库、使用jsoup API抓取图片和列表数据的基本步骤。

摘要由CSDN通过智能技术生成

Android+jsoup爬虫图片+列表

前言

"色批"是第一生产力。因为作者新手，其实copy了很多前辈的代码。
代码不规范勿喷。

一、jsoup是什么？

jsoup 是一款 Java 的HTML 解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据。

二、使用步骤

1.引入库

代码如下（示例）：

    //jsoup爬虫
    implementation 'org.jsoup:jsoup:1.13.1'
    //Rxjava+RxAndroid
    implementation 'com.github.bumptech.glide:glide:4.11.0'
    annotationProcessor 'com.github.bumptech.glide:compiler:4.11.0'
    //图片加载库
    implementation 'com.github.bumptech.glide:glide:4.11.0'
    annotationProcessor 'com.github.bumptech.glide:compiler:4.11.0'
    implementation 'com.squareup.okhttp3:okhttp:3.11.0'

2.jsoup

假设HTML的代码如下（示例）：

<img src="..." id="aa" class"aa"></img>

我们可以用jsoup的getElementById(“aa”)
，getElementsByClass(“aa”),select(“img”)来获取

3.代码

UrlUtil

public class UrlUtil {
   
    public String uri;
    public UrlUtil(String uri) {
   
        this.uri = uri;

    }
    public String getUri() {
   
        return uri;
    }

    public void setUri(String uri) {
   
        this.uri = uri;
    }
    @Override
    public String toString() {
   
        return '"'+uri+'"' ;

    }
}

GetData

public class GetData {
   

    private static final String TAG ="GetData" ;

    public static ArrayList<UrlUtil> spiderArticle(String html){
   
        ArrayList<UrlUtil> urlUtils = new ArrayList<>();

        Document document = Jsoup.parse(html);
        Elements elements = document.select("img[src~=(?i)\\.(png|jpe?g)]");
        Log.i(TAG, "spiderArticle: elements " +elements.html())

最低0.47元/天解锁文章

yzyu

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
Android+jsoup爬虫图片+列表

Android+jsoup爬虫图片+列表文章目录前言一、jsoup是什么？二、使用步骤1.引入库2.jsoup3.代码总结前言"色批"是第一生产力。因为作者新手，其实copy了很多前辈的代码。代码不规范勿喷。一、jsoup是什么？jsoup 是一款 Java 的HTML 解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据。二、使用步骤1.引入库代码如下（示例）： //jsoup爬虫
复制链接

扫一扫