网络爬虫抓包的使用

本文为原创博客,仅供技术学习使用。未经允许,禁止将其复制下来上传到百度文库等平台。如有转载请注明本文博客的地址(链接)。

网络爬虫的第一步就是分析要爬取的数据的类型,这要通过抓包完成。在浏览器里的页面发生的数据通信,只需要打开Chrome的开发者工具,切换到network选项卡就够了。


举个例子,比如要爬取东方财富网的板块数据,链接为http://quote.eastmoney.com/center/BKList.html#trade_0_0?sortRule=0
这里写图片描述

1、打开Chrome的开发者工具。
这里写图片描述


2、在这个界面里,我们重点看Name下面的一列,显示的是这个网页发出的所有请求。你可以按F5刷新下整个页面,这一列会出现更多请求。
这里写图片描述


3、然后在Name下面的一列,开始一个一个找存储真实数据的Response,找到之后对应的Headers中会有真实的URL地址。

这里写图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值