python使用execjs利用jsdom来执行含有document的js代码方案及设置环境变量

先说一下环境:win7 64位,python3.8.10。

python使用execjs执行含有document的js代码时,会出现报错:

execjs._exceptions.ProgramError: TypeError: 'document' 未定义

原因是纯js代码中是不包含浏览器里对象的(如document、window等),这时就需要一个叫做jsdom的库。全局安装命令为:

npm i jsdom -g

 

首先需要安装npm,npm是nodejs 下的包管理器。

1、登录网址Node.js

下载后安装

结果出现如下问题,需要最低Windows8.1才可以。

尝试下载一个早一点版本的,历史版本下载网址Previous Releases | Node.js 

 下载并解压,我的路径是(C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64),其中node_modules是模块,node.exe是nodejs程序,npm.cmd是包管理器。

 cmd进入此目录,运行node -v和npm -v,可以。

 现在,cmd进入npm的路径下安装jsdom。

npm i jsdom -g

 结果报错,看起来还是版本的问题:

经各种查询研究,jsdom的19.0.0的版本可以。通过下面网址可以看jsdom的各个版本。

https://www.npmjs.com/package/jsdom?activeTab=versions

https://www.npmjs.com/package/jsdom/v/19.0.0?activeTab=readme

安装指定版本(-g是指全局安装)的命令如下:

npm i jsdom@19.0.0 -g

安装完成后,cmd进入node路径下运行node

 依次输入命令,可以看到有识别window和document的环境了。

 
  1. const jsdom=require("jsdom");

  2. const {JSDOM}=jsdom;

  3. const dom = new JSDOM('<!DOCTYPE html><p>Hello world</p>');

  4. dom.window

  5. dom.window.document

退出node的方式是快捷键:ctrl+c,好像要按两遍。

至此,jsdom已经在本机安装成功,接下来就要使用python、execjs来使用它。在下节讲。

备注:要将node和npm添加至环境变量,我的电脑-右键-属性-高级系统设置-然后下图操作

编辑后,里面应该有内容,在已有内容的最后先加一个英文的;,然后把node和npm的路径C:\Users\Administrator\Downloads\node-v13.14.0-win-x64\node-v13.14.0-win-x64填入即可

========================

安装好了jsdom后,就可以编程了,直接上代码:

 
  1. import execjs#pip3.exe install PyExecJS

  2. print(execjs.get().name)

  3. js='''

  4. const jsdom = require("jsdom");

  5. const { JSDOM } = jsdom;

  6. const dom = new JSDOM(`<!DOCTYPE html><p>Hello world</p>`);

  7. window = dom.window;

  8. document = window.document;

  9. XMLHttpRequest = window.XMLHttpRequest;

  10. function signature(a,b){

  11. return a+b;

  12. }

  13. '''

  14. ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')

  15. result = ctx.call('signature',2,3)

  16. print(result)

因为安装jsdom的时候是全局安装,所以代码中需要cwd='包的路径'。注意:这里指的是npm中的node_modules的路径,并不是jsdom中的node_modules的路径。如图:

 下面来个更复杂的,使用jsdom来定位一段xml代码中的指定元素并且获取相应的内容。

 
  1. import execjs#pip3.exe install PyExecJS

  2. js='''

  3. const jsdom = require("jsdom");

  4. const { JSDOM } = jsdom;

  5. const dom = new JSDOM(`<PARAGRAPH>

  6. This is a text, about something, that happened on

  7. <DATE ISO="20231117">17.November 2023</DATE>

  8. . It is a very important date.

  9. </PARAGRAPH>`,{contentType: "application/xml"});

  10. window = dom.window;

  11. document = window.document;

  12. XMLHttpRequest = window.XMLHttpRequest;

  13. const dateEl = document.evaluate("PARAGRAPH/DATE", document, null, 9, null).singleNodeValue;

  14. const date = dateEl.getAttribute("ISO");

  15. function signature(){

  16. return date;

  17. }

  18. '''

  19. ctx = execjs.compile(js,cwd='C:/Users/Administrator/Downloads/node-v13.14.0-win-x64/node-v13.14.0-win-x64/node_modules/npm/node_modules')

  20. result = ctx.call('signature')

  21. print(result)

结果输出:20131117 。

其他的还没有研究,jsdom一般应该是在逆向js中编程使用吧。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值