需求:爬微信公众号内容。
原理:微信公众号采用https方式传输数据,抓包无法获得明文。访问公众号使用代理,手机上安装根证书,实现中间人攻击。
anyproxy与wechat_spider都依赖node.js 8.6+版本
wechat_spider依赖mongo和redis
具体操作方法如下:
1,安装anyproxy。
npm install anyproxy -g
2,生成根证书。
anyproxy-ca
3,启动anyproxy。
pm2 start anyproxy -x — -i
启动后应能在8102端口看到anyproxy的运行页面。
![](https://i-blog.csdnimg.cn/blog_migrate/01eb0e7bcf1fb598e2147d30eb2fe86f.png)
4,下载wechat_spider。
git clone https://github.com/lqqyt2423/wechat_spider.git
5,修改config.js中的mongo和redis的配置,如果redis无密码,可删除password行。
![](https://i-blog.csdnimg.cn/blog_migrate/e19ebb9f0cbccf41549d81c6a886c625.png)
![](https://i-blog.csdnimg.cn/blog_migrate/47e60016bba1d88d9ffdcbd820342ad7.png)