Python爬虫淘宝商品详情页价格、类似数据

本文介绍了如何使用Python爬虫抓取淘宝商品详情页的动态价格和评论数据。通过Chrome插件Toggle JavaScript展示了动态内容的重要性,并详细解释了查找商品价格和评论链接的过程,包括在网络请求中添加Referer字段。最后,给出了使用正则表达式从JSON数据中抽取第一页评论的示例代码及运行结果。
摘要由CSDN通过智能技术生成

  在讲爬取淘宝详情页数据之前,先来介绍一款 Chrome 插件:Toggle JavaScript (它可以选择让网页是否显示 js 动态加载的内容),如下图所示:

这里写图片描述

当这个插件处于关闭状态时,待爬取的页面显示的数据如下:

这里写图片描述

当这个插件处于打开状态时,待爬取的页面显示的数据如下:

这里写图片描述

  可以看到,页面上很多数据都不显示了,比如商品价格变成了划线价格,而且累计评论也变成了0,说明这些数据都是动态加载的,以下演示真实价格的找法(评论内容找法类似),首先检查页面元素,然后点击Network选项卡,刷新页面,可以看到很多动态加载的数据,在里面找到包含商品价格的链接(可以使用Ctrl+f查找),如下图所示:

这里写图片描述

  将此链接在新的标签页打开&#x

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青年夏日科技

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值