python爬虫爬取京东、淘宝、苏宁上华为P20购买评论

爬虫爬取京东、淘宝、苏宁上华为P20购买评论

1.使用软件

Anaconda3

2.代码截图

三个网站代码大同小异,因此只展示一个

1232041-20190330135605406-1030403549.png

3.结果(部分)

京东

1232041-20190330135652042-1163943793.png

淘宝

1232041-20190330135714768-1680337152.png

苏宁

1232041-20190330135728716-525555669.png

4.分析

这三个网站上的评论数据是动态的,无法直接获取html解析出来。这些数据是通过数据包的传输获取到这些评论信息,其中通过浏览器开发者模式对数据包的查找,得知京东和淘宝是通过后台发的前端的json包解析得到,而苏宁是js包。但是经过分析,包结构均为:字段(json)结构。只要简单的去掉“字段()”结构就是简单的json数据,之后便可以引入python的json包,调用其中的方法便可以提取出评论的字符。

转载于:https://www.cnblogs.com/doimpossible/p/10626721.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值