java爬虫微信公众号信息_微信公众号爬虫项目(reptile)

项目背景

个人在业余时间,写的一个以微信公众号爬虫为主要功能,普通网页爬虫、浏览器控制、邮件群发功能为辅的简单DEMO。功能简单,给开发者巨大的学习和发挥的空间。对spring boot和html有一些经验的人来说,上手简单,学习成本低.

功能介绍

爬虫项目,微信公众号文章爬虫,网站文章爬虫,群发邮件系统

项目架构

springBoot 单项目架构

已知爬取微信公众号有三种方法:

第一种:用搜狗微信公众号搜过,这个只能收到前10条;(亲试,好多公众号连近10条都获取不到,放弃)

第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。

第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。(每天请求次数限制,约为100次)

使用须知

程序原理:

通过selenium登录获取token和cookie,再自动爬取和下载

使用前提:

1、修改项目中Chrome驱动的路径改为自己本地的

2、有自己的公众号,没有可以申请一个微信公众号(个人订阅版)(https://mp.weixin.qq.com)

3、修改reptile.properties文件中的账号和密码

安装教程

git下载源码

maven构建

idea-java运行

使用说明

core核心包 java主方法运行

spring boot 主类运行(只加载了微信公众号爬虫的定时任务)

功能简介

简单的爬虫系统和邮件系统 1.爬虫分为微信公众号爬虫和和普通网页爬虫(主要通过selenium和jsoup实现) 2.java邮箱发送系统,可以实现邮件群发(主要通过javax.mail实现)

系统运行视图

dea4ad4c1b86712847be2f8d01a86a41.png

可视化页面

e2dfb823c0031efc2c414719679fe46d.png 

f0263143a8dc9598816b1752ed0656c9.png 

1a395668943a0f3caf44d711399a3cae.png

技术交流&问题反馈

联系QQ:1334512682

微信号:vxhqqh

捐赠

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值