Android+jsoup爬虫图片+列表

本文介绍了如何在Android应用中结合jsoup进行网页爬虫操作,包括解析HTML、获取元素以及在实际项目中的应用。通过示例展示了引入库、使用jsoup API抓取图片和列表数据的基本步骤。
摘要由CSDN通过智能技术生成

Android+jsoup爬虫图片+列表


前言

"色批"是第一生产力。因为作者新手,其实copy了很多前辈的代码。
代码不规范勿喷。

一、jsoup是什么?

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。

二、使用步骤

1.引入库

代码如下(示例):

    //jsoup爬虫
    implementation 'org.jsoup:jsoup:1.13.1'
    //Rxjava+RxAndroid
    implementation 'com.github.bumptech.glide:glide:4.11.0'
    annotationProcessor 'com.github.bumptech.glide:compiler:4.11.0'
    //图片加载库
    implementation 'com.github.bumptech.glide:glide:4.11.0'
    annotationProcessor 'com.github.bumptech.glide:compiler:4.11.0'
    implementation 'com.squareup.okhttp3:okhttp:3.11.0'

2.jsoup

假设HTML的代码如下(示例):

<img src="..." id="aa" class"aa"></img>

我们可以用jsoup的getElementById(“aa”)
,getElementsByClass(“aa”),select(“img”)来获取

3.代码

UrlUtil

public class UrlUtil {
   
    public String uri;
    public UrlUtil(String uri) {
   
        this.uri = uri;

    }
    public String getUri() {
   
        return uri;
    }

    public void setUri(String uri) {
   
        this.uri = uri;
    }
    @Override
    public String toString() {
   
        return '"'+uri+'"' ;

    }
}

GetData

public class GetData {
   

    private static final String TAG ="GetData" ;

    public static ArrayList<UrlUtil> spiderArticle(String html){
   
        ArrayList<UrlUtil> urlUtils = new ArrayList<>();

        Document document = Jsoup.parse(html);
        Elements elements = document.select("img[src~=(?i)\\.(png|jpe?g)]");
        Log.i(TAG, "spiderArticle: elements " +elements.html())
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值