windows微信公众号采集系统


采集目标: 微信公众号文章的阅读数、在看数、评论数、评论列表,还有微信公众号的账号基本信息。

采集难点: 采集以上数据需要客户端的一些参数,比如 x-wechat-key__bizappmsg_tokenpass_ticket等。

采集方式: 通过Windows客户端+mitmproxy的方式获取加密参数

采集流程:
在这里插入图片描述

备注: 一个微信号每天只能获取5000-8000篇文章的阅读/点赞/评论等数据

github: https://github.com/lixi5338619/weixin-spider


环境配置

1. mitmproxy安装:

在python3下直接使用pip进行安装,如果下载缓慢需要换源下载。

pip install mitmproxy==4.0.4 --use-feature=2020-resolver

安装完成之后,在cmd命令行中输入 mitmdump ,默认是8080端口。

mitmdump

启动成功后,下载mitm证书:访问 http://mitm.it/
点击windows,下载安装。

如果网页显示 If you can see this, traffic is not passing through mitmproxy。
按照第二步设置windows本地代理后再次安装。
在这里插入图片描述

2. windows本地代理:

windows10本地: 设置 ==> 网络 ==> 代理 ==> 手动设置代理 中打开使用代理并将IP地址修改为127.0.0.1 端口修改为默认8080或修改后的端口。 (记得点击保存)
在这里插入图片描述

3. 数据库

mysql: 下载完成之后启动服务,修改项目settings配置文件,创建数据库weixin_spider,字符集utf8mb4。

create database weixin_spider  DEFAULT CHARACTER SET utf8mb4;

redis: 下载安装后启动服务,修改项目settings配置文件,以及addons.py文件。

4. 本地模块

参照 requirements文件安装 python库,如有遗漏,根据提示自行安装


准备工作

首先确定使用环境安装完毕,然后请确保端口(5000、8080)不冲突。

1、确定mysql 、redis服务开启状态,并可正常连接

2、运行 webapp\models.py 文件创建数据库表,查看表结构是否生成正确
在这里插入图片描述
3、登录微信PC版,找到 文件传输助手 对话框, 双击 文件传输助手 ,文件传输助手会自动弹出单独的对话窗口,把对话框锁死在屏幕左上角,具体位置可能需要根据显示器调整。
在这里插入图片描述
4、依次运行py脚本(亦可运行.sh文件代替)

  • 运行 wx_monitor.py ,确定程序是否成功启动
  • 运行 manage.py ,打开网页 http://127.0.0.1:5000/ ,确认成功开启web服务。

5、开启mitmproxy,确保可以拦截到数据(需要cd到tools目录下)

cd tools/ && mitmdump -s ./addons.py  --ssl-insecure

在这里插入图片描述


启动测试

准备工作完成之后,访问 http://127.0.0.1:5000/ 。
在这里插入图片描述
添加公众号,该公众号需要微信已经关注过

点击启动,即可进行采集。

在这里插入图片描述


目录结构

weixin-spider
│ manage.py (web服务启动文件)
│ README.md (项目说明文档)
│ requirements.txt (项目安装包)
│ wx_monitor.py (任务调度中心)

├─api
│ │ crawlerapi.py (爬虫文件)
│ │ init.py
│ │
├─exceptions (异常捕获目录)

├─tools
│ │ addons.py (mitm配置)
│ │ handle.py (自动化操作)
│ │ keys.py (redis-keys管理)
│ │ proxy.py (本地代理)

├─webapp
│ │ models.py (数据库表模型)
│ │ _init_.py
│ ├─static (静态资源目录)
│ ├─templates(html文件目录)
│ │
│ ├─wxapp
│ │ │ selffilter.py (过滤器)
│ │ │ views.py (视图文件、接口)


github: https://github.com/lixi5338619/weixin-spider

在这里插入图片描述

  • 5
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 42
    评论
ASP.NET微信公众号平台系统源码是一种用于构建微信公众号的框架和代码库。它提供了一系列的接口和功能,帮助开发人员快速地搭建和定制自己的微信公众号平台。 该系统源码基于ASP.NET技术开发,结合微信公众号开放平台的接口和功能进行了集成。它提供了一种便捷的方式,让开发人员可以通过编写少量的代码来实现与微信公众号的交互和功能扩展。 ASP.NET微信公众号平台系统源码具备以下特点和功能: 1. 用户管理:能够管理微信公众号的用户信息,包括用户的基本信息、关注状态、交互记录等。 2. 消息管理:能够接收和发送微信公众号的消息,包括文本消息、图片消息、语音消息、视频消息等。 3. 菜单管理:能够创建和管理微信公众号的自定义菜单,包括点击菜单、跳转链接、触发推送消息等。 4. 接口管理:能够对接微信公众号开放平台的各种接口,包括获取用户信息、发送模板消息、创建二维码等。 5. 素材管理:能够上传和管理微信公众号的素材,包括图文消息、图片、音频、视频等。 6. 数据统计:能够统计微信公众号的用户活跃度、消息互动情况、菜单点击量等数据。 ASP.NET微信公众号平台系统源码的优势在于它具有良好的扩展性和定制性,开发人员可以根据自己的需求进行二次开发和定制。同时,它也提供了一定的安全机制和权限控制,保障了用户信息和数据的安全性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 42
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

考古学家lx(李玺)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值