以某乎为实战案例,教你用Python爬取手机App数据

1、前言

最近爬取的数据都是网页端,今天来教大家如何爬取手机端app数据(本文以ios苹果手机为例,其实安卓跟ios差不多)!

本文将以『某乎』为实战案例,手把手教你从配置到代码一步一步的爬取App数据!

2、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!)

配置Connections

打开Fiddler后,点击Tools->Options
在这里插入图片描述
点击Connections
在这里插入图片描述
勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!
在这里插入图片描述

勾选上对应的选项
最后抓包工具Fiddler就配置好了
记得重启Fiddler!重启Fiddler!重启Fiddler!不然可能不生效

3、配置手机代理

1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网)

查看ip命令

window:ipconfig

在这里插入图片描述

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

在这里插入图片描述
填写好相关代理信息

在这里插入图片描述

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

在这里插入图片描述
点击下载证书后,下面就开始安装(看图操作)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
ok,这样手机端就配置完成,下面开始抓取数据!!!

4、抓取数据

1.打开某乎app

在这里插入图片描述

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

在这里插入图片描述
这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件
在这里插入图片描述
这样我们获取的数据包列表就都是过滤条件内的目标网址

在这里插入图片描述

3.查找数据包

比如点击热榜
在这里插入图片描述
对应的https加密数据包如下:
在这里插入图片描述
数据包中的数据如下:
在这里插入图片描述
提取出url链接
在这里插入图片描述

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

在这里插入图片描述
ok这样就可以将数据获取下来!

5、总结

  1. 配置抓包工具Fiddler(重点)。
  2. ios苹果手机配置证书和设置代理(安卓手机也类似)。
  3. 简单使用Fiddler(过滤数据包、查看数据包等)。
  4. 本文以某户为实战,实现了python爬取手机app数据(详细教程,推荐收藏)。
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值