爬取京东具体商品页面_京东爬虫、数据分析、报表 (1)

1bc942e15a2798290aa197e69f6bf02a.png

最近马上到618了,目前用的是1080的显示器,想换个2k显示器,就去看了下京东的2k显示器,顺便整合了下爬虫,数据分析,报表这些知识,进行了结合。

一 界面分析

先去京东,搜索显示器,选择2k,看到总共大约1900+个商品

6f0507c1b5aaa464205dbb2e50eee89d.gif

京东对爬虫还算比较友好。往下拖动页面发现是滑动加载的,

第一次进来只展示了30个商品,剩余30个需要下拉界面才能加载。

那么,可以考虑用两个办法:

  • selenium 简单粗暴
  • 找相关接口

京东这个接口比较简单,我们直接找接口就行,浏览器F12,点击网络,点击XHR,然后鼠标在商品页面下滑,发现XHR出现了一条新的数据,点开这条数据进行,发现就是加载的商品信息。

1943102cc1cfe0937e607f779100b781.gif

然后去看请求头,

8af454018aeac95eb81c9c19594bb1f1.png

请求url,经测试可以缩减为

https://search.jd.com/s_new.php?keyword=显示器&wq=显示器&ev=3613_104528%5E&page=1&s=30

page为页数,s为每页加载数量

分析出接口了,现在要看抓什么信息了

ec91168093287fa1acc3c39a7d347e5c.png

如上图,是一个商品的基本信息,我们可以抓取的有:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值