1、安装相关的库
requests、json、re、lxml等
2、完整代码
3、获取登录信息
首先我们用自己的公众号登陆,点击“新的创作”,打开创作页面后点击上方超链接选项,f12(如果没反应就Fn+f12)打开查看网页代码工具
然后在公众号那里输入要获取数据的公众号名字,回车选择,网页工具中会出现一条appmsg?action=list_ex&begin=0&count=5&fakeid=MzA4MzA4MDc5Mg==&type=9&query=&token=6503456&lang=zh_CN&f=json&ajax=1
其中Headers内包含访问网站所需要的四个信息
cookie:些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。
user-agent:用户代理
token:在计算机身份认证中是令牌(临时)的意思
fakeid:对应我们的公众号,如果爬取其他公众号只需要更改这个参数。
将对应的信息复制到python代码中
4、获取推送信息
需要下载抓包软件fiddler,打开fiddler后,从微信公众号点击一篇推送,找到蓝色这个网址,复制cookie,user-agent
然后找到getsppmsg这个网址,复制url、key、pass_ticket、appmsg_token
5、结果