Java实现简单爬虫

Java实现简单爬虫😋


超级简单的爬虫,直接引入jsoup依赖,即可编写获取指定网页的信息,很简单的一个爬虫。(一个小案例)

//一个小案例仅供参考
public class Reptile {
    public static void main(String[] args) throws IOException {
        //指定爬取的网页
        String url="https://pic.netbian.com/4kdongman/";
        //通过Jsoup后去指定路径的页面信息
        Document document= Jsoup.parse(new URL(url),10000);
        //获取id=main的标签
        Element content=document.getElementById("main");
        //获取img标签
        Elements imgs=content.getElementsByTag("img");
        System.out.println(imgs);
        //存放图片的文件名
        int id=0;
        //视情况而定,有的获取的img图片url不需要
        String urlHead="https://pic.netbian.com/";
        //通过遍历获取img的url
        for(Element img:imgs){
            String src=urlHead+img.attr("src");
            URL target=new URL(src);
            URLConnection urlConnection=target.openConnection();
            //获取输入流
            InputStream inputStream=urlConnection.getInputStream();
            id++;
            //输出流到指定文件位置
            OutputStream outputStream=new FileOutputStream("D:\\Java\\JavaProject\\Easy_reptile\\src\\main\\static\\"+id+".jpg");
            //写入写出
            int temp=0;
            while((temp=inputStream.read())!=-1){
                outputStream.write(temp);
            }
            System.out.println(id+".jpg下载完成!");
            //关闭流
            outputStream.close();
            inputStream.close();
        }
    }
}

在这里插入图片描述


完工! (不要乱爬哟~)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

每日小新

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值