京东反爬措施导致无法爬取商品价格和评论等信息解决方法

本文介绍了在爬取京东商品信息时遇到的价格和评论为空的问题及解决方案。问题根源在于京东使用json存储关键数据,并通过ajax请求获取。解决方法包括:定位获取价格的ajax接口,通过产品id构造请求url获取价格;找到ProductCommentSummaries相关js文件,替换商品id获取评论等其他数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

**问题描述:**在直接对京东商品的网页源码进行xpath解析时,获得的价格数据和评论数量等信息为空。

**问题分析:**经过分析发现,通过接口分析,京东商品的价格和评论信息均由jason保存。通过查找json找到相应的接口,请求数据即可解决。

解决方法:
1、第一步,寻找接口的突破口,就是接口全文检索,关于这个价格的信息
在这里插入图片描述
仔细查找发现了获得价格的函数。调用了ajax,如此我们分析,是不是每个价格都是通过请求url+产品id得到的呢?

2、简单尝试
第一个:
在这里插入图片描述
第二个:
在这里插入图片描述
多次随机尝试发现的确如此。

那么即可确定这样能获得产品价格。

3.通过url: //p.3.cn/prices/mgets?skuIds=J_ + 产品id,生成网址请求页面即可获得价格数据所在json。(产品id即产品详情页网址中的那一串数字)

4.评论和销量、好评数据:<

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值