本篇文章介绍一种通过抓包的形式来获取公众号文章,主要是抓包PC端的微信公众号文章,比较容易上手,只要用过抓包软件一般都不难的。这里使用Fiddler 4抓包软件,很常用的一款软件,也满足我们的要求了。
准备工作
-
抓包软件
-
使用Fiddler4
安装好Fiddler4,打开Fiddler4并配置好,那么我们就能愉快的使用它了。
-
公众号
从PC端选择其他一个公众号,点击查看历史消息。
-
抓包中的json文件
开启抓包软件之后,我们就可以查看公众号的历史消息了,通过滚动滚动条,不断的刷新公众号的文章,就可以在抓包软件中发现了我们想要的json文件了。
-
json的数据格式如下
{
"ret":0,
"errmsg":"ok", #请求状态
"msg_count":10, #信息条数
"can_msg_continue":1, #代表是否还可以抓取或者说是否有下一页,1代表有下一页,0代表是最后一页
"general_msg_list":"{"list":[]}", #公众号文章信息
"next_offset":20,
"video_count":1,
"use_video_tab":1,
"real_type":0,
"home_page_list":[]
}
-
json数据的地址
每次下拉刷新公众号的文章的时候,都会请求https://mp.weixin.qq.com/mp/profile_ext地址,而且是get请求,请求的参数如下:
通过手动浏览器的多次测试,主要需要的参数如下:
action:固定参数值getmsg
__biz:微信公众号的唯一