某天接到一个需要抓取某某微信公众的所有历史文章的阅读数、点赞和再看数据的需求。
为了解放双手,就用 Python 代码撸一个,选择 MitmProxy 代理作为抓包工具,因为它可以使用 Python 代码监听抓取到的 url,用于自动获取 cookie 等场景。
mitmproxy 是一个支持 HTTP 和 HTTPS 的抓包程序,有类似 Fiddler 的功能。
mitmproxy 还有两个关联组件。一个是 mitmdumvp,它是 mitmproxyv 的命令行接口,可以利用 Python 代码监听请求。另一个是 mitmweb,它是一个 Web 程序,可以观察 mitmproxy 抓取的请求。
使用 pip 安装
pip install mitmproxy
安装好之后,将手机端的代理 IP 设置为和 PC 的 IP 地址一样,和代理端口设置为:8080,用下面命令启动
mitmweb
将看到浏览器打开了一个 http://127.0.0.1:8081/#/flows
网页,这个就是 MitmProxy 的 web 控制台
在手机端浏览器输入 mitm.im
获取 PC 证书 和手机端的证书,都安装一下
注意:android 手机在安装证书时需要在[从存储设备安装]界面安装
当安装好证书和设置好手机端 IP 代理后,随便点击一篇微信公众号文章(这里使用本公众)
从图上可以看到,阅读、再看、点赞的 url 为 https://mp .weixin. qq. com/mp/getappmsgext
(提示:如果没有这个链接,可以右上角刷新文章),再看下它的 request 请求需要哪些东西