python爬虫异步加载图片_python爬虫之爬取动态加载的图片_百度

运行坏境

python3.xhtml

选择目标——百度

当咱们在使用右键查看网页源码时,出来的倒是一大堆JavaScript代码,并无图片的连接等信息python

由于它是一个动态页面嘛。它的网页原始数据实际上是没有这个图片的,经过运行JavaScript,把这个图片数据把它插入到网页的html标签里面json

那这样形成的结果是,咱们在开发者工具中虽然能看到这个html标签,但实际上,当咱们在看网页的原始数据的时候,实际上是没有这个标签的,它只在运行时加载和渲染python3.x

进行抓包就行了,咱们点击Network–XHR,而后咱们在往下滑动滚动条时,会一直出现一个名为:acjson?tn=resultjson&ipn=…的请求,点击它再点Preview,咱们看到这是一条json数据,点开data,咱们看到这里面有30条数据,每一条都对应着一张图片。app

以下:工具

因而咱们就清楚了,百度图片一开始只加载30张图片,当咱们往下滑动滚动条时,页面会动态加载json数据,每条json数据里面包含了30条信息,信息里面又包含了图片的URL,JavaScript会将这些url解析并显示出来。这样,每次滚动到底就又多出30张图片。url

那么,这些一直出现的json数据有什么规律呢?spa

咱们点击Headers,而后对比这些json数据的头部信息。code

经过对比,咱们发现h

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值