python微信点赞脚本_Python爬取微信公众号评论、点赞等相关信息

微信公众号爬虫方案分析(爬取文艺相处公众号)

之前考虑过使用搜狗微信来爬取微信公众号信息,不过搜狗提供的数据有诸多弊端,比如文章链接是临时的,文章没有阅读量等指标,所以考虑通过手机客户端利用 Python 爬微信公众号文章。

因为微信公众平台并没有对外提供 Web 端入口,只能通过手机客户端查看公众号文章,所以使用Fiddler来进行抓包,分析微信公众号相关操作的请求信息,后面通过Python 代码来模拟微信请求。

抓取公众号所有历史文章

使用 Fiddler 抓包方式,打开手机某个微信公众号历史文章列表,上拉加载更多,此时可以找到加载更多文章的 URL 请求地址:

%E8%8E%B7%E5%8F%96%E6%9B%B4%E5%A4%9A%E9%A1%B5%E9%9D%A2.png?raw=true

分析response,几个字段信息:

ret:请求是否成功,0就表示成功

msg_count: 返回的数据条数

can_msg_continue: 是否还有下一页数据

next_offset: 下一次请求的起始位置

general_msg_list:真实数据

general_msg_list是历史文章里面的基本信息,包括每篇文章的标题、发布时间、摘要、链接地址、封面图等,而像文章的阅读数、点赞数、评论数、赞赏数这些数据都需要通过额外接口获取。

通过字段 can_msg_continue 确定是否继续抓取,再结合 next_offset 就可以加载更多数据,我们需要把 url 中可变的参数 offset 用变量来代替,递归调用直到 can_msg_continue 为 0 说明所有文章都爬取完了。

class WeiXinCrawler:

def crawl(self, offset=0):

"""

爬取更多文章

"""

# appmsg_token需刷新

url = "https://mp.weixin.qq.com/mp/profile_ext?" \

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值