很多业务可能都会抓取微信公众号。
而有些时候由于对方app或者我们技能的限制,导致并不能简单的脱壳处理。
今天我们换一种思路进行公众号抓取。
阅读流程
- 效果演示
- 抓取思路整理
- 源码地址
- 关键源码解读
- 总结
效果演示
抓取思路整理
- 使用Appium自动化控制手机,模拟用户对微信公众号列表进行相关操作
- 使用mitmproxy中间人代理拦截内容,解析出公众号列表页
- 使用python对公众号内容进行抓取
源码地址
关键源码解析
- appium部分。首先我们需要找出每个界面所对应的Activity和每个Activity界面的按钮。
from appium import webdriver
import time
from selenium.webdriver.support import expected_conditions as EC
from appium.web