python微信点赞脚本_Python爬取微信公众号评论、点赞等相关信息

最新推荐文章于 2024-04-30 21:22:14 发布

weixin_39683863

最新推荐文章于 2024-04-30 21:22:14 发布

阅读量2.6k

点赞数 3

文章标签： python微信点赞脚本

微信公众号爬虫方案分析（爬取文艺相处公众号）

之前考虑过使用搜狗微信来爬取微信公众号信息，不过搜狗提供的数据有诸多弊端，比如文章链接是临时的，文章没有阅读量等指标，所以考虑通过手机客户端利用 Python 爬微信公众号文章。

因为微信公众平台并没有对外提供 Web 端入口，只能通过手机客户端查看公众号文章，所以使用Fiddler来进行抓包，分析微信公众号相关操作的请求信息，后面通过Python 代码来模拟微信请求。

抓取公众号所有历史文章

使用 Fiddler 抓包方式，打开手机某个微信公众号历史文章列表，上拉加载更多，此时可以找到加载更多文章的 URL 请求地址：

%E8%8E%B7%E5%8F%96%E6%9B%B4%E5%A4%9A%E9%A1%B5%E9%9D%A2.png?raw=true

分析response，几个字段信息：

ret：请求是否成功，0就表示成功

msg_count：返回的数据条数

can_msg_continue：是否还有下一页数据

next_offset：下一次请求的起始位置

general_msg_list：真实数据

general_msg_list是历史文章里面的基本信息，包括每篇文章的标题、发布时间、摘要、链接地址、封面图等，而像文章的阅读数、点赞数、评论数、赞赏数这些数据都需要通过额外接口获取。

通过字段 can_msg_continue 确定是否继续抓取，再结合 next_offset 就可以加载更多数据，我们需要把 url 中可变的参数 offset 用变量来代替，递归调用直到 can_msg_continue 为 0 说明所有文章都爬取完了。

class WeiXinCrawler:

def crawl(self, offset=0):

"""

爬取更多文章

"""

# appmsg_token需刷新

url = "https://mp.weixin.qq.com/mp/profile_ext?" \

最低0.47元/天解锁文章

weixin_39683863

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python微信点赞脚本_Python爬取微信公众号评论、点赞等相关信息

微信公众号爬虫方案分析（爬取文艺相处公众号）之前考虑过使用搜狗微信来爬取微信公众号信息，不过搜狗提供的数据有诸多弊端，比如文章链接是临时的，文章没有阅读量等指标，所以考虑通过手机客户端利用 Python 爬微信公众号文章。因为微信公众平台并没有对外提供 Web 端入口，只能通过手机客户端查看公众号文章，所以使用Fiddler来进行抓包，分析微信公众号相关操作的请求信息，后面通过Python 代码来...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。