最近接到公司派的1个任务,让我爬取腾讯新闻app的热点榜
![a065e6e9d4a8693188d2e8b9765b5042.png](https://i-blog.csdnimg.cn/blog_migrate/0452e7aaf0d1ce14257e04717048e766.jpeg)
此热点新闻每10分钟更新1次,所以需要每隔10分钟爬取一次,然后保存下来。最简单的办法就是找电脑网页版,但是翻遍所有网站也没有找到这个接口,所以只好乖乖地从手机端爬了。
手机端数据接口参数分析是一件很难的事,我们可以绕过此过程,在APP数据交换的过程通过mitmproxy工具将返回的数据拦截下来。
这种方法的优点就是简便,分析接口参数,缺点是需要一台手机,不停地进行数据请求,速度相对较慢,但是对此次爬取来说足够了。为了节省1部手机,我想到了爬取手机模拟器端APP数据。
下面一起来看看我是怎么实现的吧
第一步:安装charles、appium、mitmdump和夜神手机模拟器
1.安装charles
Charles是一款代理服务器,通过过将自己设置成系统(电脑或者浏览器)的网络访问代理服务器,然后截取请求和请求结果达到分析抓包的目的。
①下载:https://www.charlesproxy.com/latest-release/download.do
下载完成后,点击安装,一路默认安装即可。
②设置代理
③安装证书
<