1. 前言
日常 Web 端爬虫过程中,经常会遇到参数被加密的场景,因此,我们需要分析网页源代码
通过调式,一层层剥离出关键的 JS 代码,使用 Python 去执行这段代码,得出参数加密前后的 Python 实现
本文将聊聊利用 Python 调用 JS 的4种方式
2. 准备
以一段简单的 JS 脚本为例,将代码写入到文件中
//norm.js//计算两个数的和function add(num1, num2) { return num1 + num2;}
其中,定义了一个方法,计算两个数的和
3. 方式一:PyExecJS
PyExecJS 是使用最多的一种方式,底层实现方式是:在本地 JS 环境下运行 JS 代码
支持的 JS 环境包含:Node.js、PyV8、PhantomJS、Nashorn 等
首先,我们需要安装依赖包 PyExecJS
//py_exec_js_demo.py//安装依赖pip3 install PyExecJS
然后,从 JS 文件中读取源码
def js_from_file(file_name): """ 读取js文件 :return: """ with open(file_name, 'r', encoding='UTF-8') as file: result = file.read() return result
<