简单地学习Java爬虫->使用Jsoup

17 篇文章 0 订阅

简单地学习Java爬虫->使用Jsoup

一、gradle环境搭建

学习参考资料:Jsoup文档

implementation 'org.jsoup:jsoup:1.11.3'

二、Activity

package com.example.testforjsoup;

import android.support.v7.app.AppCompatActivity;
import android.os.Bundle;
import android.util.Log;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class MainActivity extends AppCompatActivity {

    private String url = "https://en.wikipedia.org/wiki/Main_Page";

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        ExecutorService executorService= Executors.newSingleThreadExecutor();
        executorService.execute(new Runnable() {
            @Override
            public void run() {
                try {
                    //获取Jsoup访问url链接的文档对象
                    Document document = Jsoup.connect(url).timeout(10000).get();
                    Log.d("zbv", "document of title=" + document.title());

                    Elements newsHeadlines = document.select("#mp-itn b a");
                    for (Element element : newsHeadlines) {
                        String title = element.attr("title");
                        String text = element.text();
                        //补全作为可使用的URL
//                        String absUrl = element.absUrl("href");
                        //一般的String文本 要达到absUrl的效果可以这样:"abs:href"
                        String absUrl=element.attr("href");

                        Log.d("zbv", "title=" + title + ";text=" + text + ";absUrl=" + absUrl);
                    }

                } catch (IOException e) {
                    e.printStackTrace();
                    Log.e("zbv", "IOException", e);
                }
            }
        });

    }
}

后续更新中,写个爬取数据后的简单App。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值