Python爬取APP上的数据教程

最新推荐文章于 2024-09-19 10:02:44 发布

追梦IT男

最新推荐文章于 2024-09-19 10:02:44 发布

阅读量2.1w

点赞数 9

文章标签： Python 数据挖掘爬虫 Python基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wcg541/article/details/99117909

版权

本文详细介绍了App抓包的原理，包括客户端与服务器的交互过程，并讨论了App数据抓取的难易程度。讲解了常用抓包工具fiddler和mitmproxy的安装与使用，包括证书配置和手机连接抓包的步骤。此外，文章还提到了爬虫工程师需要掌握的技能，如Java、Android基础和逆向工程等。

摘要由CSDN通过智能技术生成

App抓包原理

1.客户端向服务器发起HTTPS请求

2.抓包工具拦截客户端的请求，伪装成客户端向服务器进行请求

3.服务器向客户端（实际上是抓包工具）返回服务器的CA证书

4.抓包工具拦截服务器的响应，获取服务器证书公钥，然后自己制作一张证书，
将服务器证书替换后发送给客户端。（这一步，抓包工具拿到了服务器证书的公钥）

5.客户端接收到服务器（实际上是抓包工具）的证书后，生成一个对称密钥，
用抓包工具的公钥加密，发送给“服务器”（抓包工具）

6.抓包工具拦截客户端的响应，用自己的私钥解密对称密钥，然后用服务器证书公钥加密，
发送给服务器。（这一步，抓包工具拿到了对称密钥）

7.服务器用自己的私钥解密对称密钥，向客户端（抓包工具）发送响应

8.抓包工具拦截服务器的响应，替换成自己的证书后发送给客户端

爬虫的本质就是「骗」过服务器,各种反反爬手段就是增强信任的过程,不停的让服务器相信你是自己人
如果你被反爬了,就是你骗术不精,被发现了。

App数据好抓吗？

App数据有易有难,目前我还是停留在简单的部分,这里简单说下我理解的(如果说错求放过):

简单:

app的数据比web端数据更容易抓取，基本都是http、https协议，返

最低0.47元/天解锁文章

关注

9
点赞
踩
117

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。