Jsoup 爬取网页内容样例

Jsoup 爬虫爬取网页内容

springboot导入maven依赖

<!--解析网页jsoup-->
<dependency>
	<groupId>org.jsoup</groupId>
	<artifactId>jsoup</artifactId>
	<version>1.10.2</version>
</dependency>

在这里插入图片描述

java操作

public List<Content> parseJD(String keywords) throws IOException {
        //获取请求 https://search.jd.com/Search?keyword=java&enc=utf-8&pvid=5452d8c0790c4c6fb86b61a5c8e9b880
        //前提,需要联网

        String url = "https://search.jd.com/Search?keyword="+ keywords+"&enc=utf-8";

        //解析网页(Jsoup 返回的就是Document 浏览器Doc对象)
        Document document = Jsoup.parse(new URL(url), 30000);
        Element element = document.getElementById("J_goodsList");


        Elements elements = element.getElementsByTag("li");

        ArrayList<Content> goodsList = new ArrayList<>();
        // System.out.println(elements.html());
        for (Element e1 : elements) {
            String img = e1.getElementsByTag("img").eq(0).attr("data-lazy-img");

            String price = e1.getElementsByClass("p-price").eq(0).text();

            String title = e1.getElementsByClass("p-name").eq(0).text();

            goodsList.add(new Content(title, img, price));

//            System.out.println("==========================");
//            System.out.println(img);
//            System.out.println(price);
//            System.out.println(title);

        }
        return goodsList;
    }

结果:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值