微信小程序公众号订阅号,历史热门文章内容,留言阅读数量点赞数量等数据都可以采集抓取,怎样做?方法会很难吗?楚江数据 p02721606 给你几个微信公众号爬虫,微信数据采集爬取so easy!
1.基于搜狗微信搜索的微信公众号爬虫
a. 项目地址:https://github.com/Chyroc/WechatSogou
b. 基于搜狗微信搜索的微信公众号爬虫接口开发,可获取文章的临时链接,获取微信公众号的最近10篇文章
2.微信公众号爬虫 (基于中间人攻击的爬虫核心实现,支持批量爬取公众号所有历史文章)
a. 项目地址:https://github.com/sundy-li/wechat_spider
b. 通过Man-In-Middle 代理方式获取微信服务端返回,自动模拟请求自动分页,抓取对应点击的所有历史文章
3.使用Python实现的微信公众号爬虫
a. 项目地址:https://github.com/bowenpay/wechat-spider
4.爬取指定微信公众号的全部历史文章,使用 JS 实现
a. 项目地址:https://github.com/iamyy/wechat-spider
b. 目前需要手动获取 cookie 等验证信息
5.基于搜狗微信入口的微信爬虫程序,使用Python实现。
a. 项目地址:https://github.com/CoolWell/wechat_spider
b. 由基于phantomjs的python实现。 使用了收费的动态代理。 采集包括文章文本、阅读数、点赞数、评论以及评论赞数。 效率