java 抓取京东商品,Java爬虫爬取京东商品信息

以下内容转载于《https://www.cnblogs.com/zhuangbiing/p/9194994.html》,在此仅供学习借鉴只用。

Maven地址

org.jsoup

jsoup

1.11.2

网页分析:

c367f8a32cb6a75654a49eb1908d35fc.png

商品布局分析:

3fc54d3efb7acf4cae9d20eb577e66f6.png

测试代码实例:

importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document;importorg.jsoup.nodes.Element;importorg.jsoup.select.Elements;/*** 作者:小鱼

* 作者唯一QQ号:1132017151

*

* 简单测试类

* 包含内容:京东商品页查询

* 不包含京东商品排除个性化查询和后半部动态加载,如有想要了解,请联系作者

**/

public classTest {public static void main(String[] args) throwsException {

String url= "https://search.jd.com/Search?keyword=%E6%89%8B%E6%9C%BA&enc=utf-8&psort=3&page=3";//第二页商品//网址分析

/*keyword:关键词(京东搜索框输入的信息)

* enc:编码方式(可改动:默认UTF-8)

* psort=3 //搜索方式 默认按综合查询 不给psort值

* page=分业(不考虑动态加载时按照基数分业,每一页30条,这里就不演示动态加载)

* 注意:受京东商品个性化影响,准确率无法保障

**/Document doc= Jsoup.connect(url).maxBodySize(0).get();//doc获取整个页面的所有数据

Elements ulList = doc.select("ul[class=‘gl-warp clearfix‘]");

Elements liList= ulList.select("li[class=‘gl-item‘]");//循环liList的数据

for(Element item : liList) {//排除广告位置

if (!item.select("span[class=‘p-promo-flag‘]").text().trim().equals("广告")) {//如果向存到数据库和文件里请自行更改

System.out.println(item.select("div[class=‘p-name p-name-type-2‘]").select("em").text());//打印商品标题到控制台

}

}

}

}

运行结果:

8700700cc32b2a1f6cce9c34dee2a105.png

原文:https://www.cnblogs.com/hzb462606/p/9195602.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值