python3 + fiddler爬取微信公众号消息记录

关注了一个公众号 —— 书单来了,再也不用担心闹书荒了!【棒到飞起!】
但关注的时间长了也发现了一个问题,有时候想找一本曾经在某个书单中推荐过的书,就该翻箱倒柜了,即使有历史消息,也有书单狗整理的书单库,但每次查找还是很费时间。鉴于最近在接触python,于是起了一个念头:把微信公众号的消息记录爬下来,把我关心的那些数据存到数据库,查找浏览不就更方便了么。这两天闲暇时间折腾一番,终于搞定。源码:https://github.com/ttshen1029/crawling_wx_history 下面正式开始。

【思路】:
其实思路很简单,通过抓包工具获取访问的地址和header信息,用python模拟访问拿到消息记录,通过筛选留下书籍推荐消息,并通过正文链接继续爬取正文内容,对页面进行分析并存储有用信息。继续往下拉是通过ajax获取json格式的数据的,这个对数据的处理就更方便了。数据都存在数据库之后查看起来就很方便了,暂时就懒得做展示页面了。效果如下图,虽然粗糙了点,但初步完成了我的目标:
这里写图片描述

怕自己忘记,有几个点记录一下:
1、fiddler设置
– Connections
这里写图片描述
– HTTPS : 微信访问涉及https协议,所以需要配置一下
这里写图片描述
2、手机安装HTTPS证书(不需要捕获HTTPS,则忽略此步)
a.首先确定Fiddler所在电脑的IP地址:例:192.168.1.xx
b.用手机打开浏览器,访问http://192.168.1.xx:8888,点”FiddlerRoot certificate” 然后安装证书。
3、在同一个局域网中,手机端无线局域网HTTP代理设置,服务器:上述IP地址,端口8888
4、在手机端访问公众号历史消息,即可在获取到抓包信息
这里写图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值