概述
常用的三种处理js的方式:
1、用selenium ,模拟浏览器
2、用可以执行js代码的库 来执行关键的js代码
3、找到js的执行规则,分析加密规则,用python的代码来模拟(最优解)
查找js的执行规则
1、爬虫爬数据时,提交post请求,其中一个参数由js加密生成如下:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/f539ff28281f591e36c57ecfb41bf6ef.png)
如何确定s是哪个js文件定义的,用如下方法:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/1f2ef9e3de81dcf0d185c780ba72c25d.png)
如上图所示,s =bb(cc.m(ss+tt))。很明显ss和tt是链接和时间戳。关键点是找cc,用同样的方法找cc:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/a6efbac19569399f34b88456d379f625.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/7e07771fdf6660a264d74618a6a08020.png)
可以看到cc.m是做md5加密(同样的道理可以找到aa)。
最终得出结果:s =bb(链接和时间戳连接起来md5加