python抓取微信公众号文章【基于Fiddler抓包】

本篇文章介绍一种通过抓包的形式来获取公众号文章,主要是抓包PC端的微信公众号文章,比较容易上手,只要用过抓包软件一般都不难的。这里使用Fiddler 4抓包软件,很常用的一款软件,也满足我们的要求了。

准备工作

  • 抓包软件

    Fiddler 4传送门

  • 使用Fiddler4

    安装好Fiddler4,打开Fiddler4并配置好,那么我们就能愉快的使用它了。

  • 公众号

    从PC端选择其他一个公众号,点击查看历史消息。
    选择公众号

  • 抓包中的json文件
    开启抓包软件之后,我们就可以查看公众号的历史消息了,通过滚动滚动条,不断的刷新公众号的文章,就可以在抓包软件中发现了我们想要的json文件了。
    json文件

  • json的数据格式如下

	{
	"ret":0,
	"errmsg":"ok", #请求状态
	"msg_count":10,	#信息条数
	"can_msg_continue":1,	#代表是否还可以抓取或者说是否有下一页,1代表有下一页,0代表是最后一页
	"general_msg_list":"{"list":[]}", #公众号文章信息
	"next_offset":20,
	"video_count":1,
	"use_video_tab":1,
	"real_type":0,
	"home_page_list":[]
	}
  • json数据的地址

    每次下拉刷新公众号的文章的时候,都会请求https://mp.weixin.qq.com/mp/profile_ext地址,而且是get请求,请求的参数如下:
    请求参数
    通过手动浏览器的多次测试,主要需要的参数如下:

action:固定参数值getmsg
__biz:微信公众号的唯一
  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值