python 爬虫 小程序_python爬取微信小程序中的内容

1. 打开微信小程序,读取完成。手机端备份微信(建议先清理微信,只留需要的微信小程序)。将文件发送至电脑端。

2.解压文件,获取.wxapkg文件(目录:E:\文件\2018-1121-150948\App\com.tencent.mm\MicroMsg\7f8cfdcb69afe1de135abf896d6612b3\appbrand\pkg)下方:_-620779444_58.wxapkg

3.将获取到的文件使用node.js进行反编译。可参考地址:(https://github.com/qwerty472123/wxappUnpacker),

31687ee5f1fe

需要安装node.js 。

将这八个文件放入同一目录下,并将.wxapkg文件放入在当前目录下启用命令行。

npm install esprima

npm install css-tree

npm install cssbeautify

npm install vm2

npm install uglify-es

然后开始反编译:

node wuWxapkg.js D:\xxxxxxxxx.wxapkg 需要注意目录不要写错。

如果报错:Error: Cannot find module "xxxxxxxx" 就是需要安装xxxxxx

31687ee5f1fe

npm install xxxxxx 就行了。

地址写错会报:

31687ee5f1fe

4.使用微信小程序打开反编译好的文件。下载地址:(下载 · 小程序)。即可获取当前小程序中的HTML文件。

总结: 大神真的很牛逼,反编译反正我是看不懂。。。。。获取到的内容直接通过lxml bs4 re 进行提取即可。我也是个爬虫菜鸟。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值