常见的java调用python脚本方式
通过jython提供的类库实现
通过Runtime.getRuntime()开启进程来执行脚本文件
通过jython提供的类库实现
通过jython实现的话,我们需要引入jar包(jython官网:https://www.jython.org/),具体我写了一个demo,假设你的python代码为test.py:
public static voidmain(String[] args) {
PythonInterpreter interpreter= newPythonInterpreter();
interpreter.execfile("E:\\workspace\\pycharm_workspace\\weixincrawer\\test.py");
PyFunction function= (PyFunction)interpreter.get("my_test",PyFunction.class);
PyObject pyobject= function.__call__(new PyString("huzhiwei"),new PyString("25"));
System.out.println("anwser = " +pyobject.toString());
}
输出结果:
name: huzhiwei
age:25anwser= success
到此是没有什么问题的,我们使用function.call方法传入参数调用python函数,使用pyobject.toString()方法拿到python中my_test函数的返回值,但是如果你把test.py稍微做下修改如下:
importrequestsdefmy_test(name, age):
response= requests.get("http://www.baidu.com")print("name:"+name)print("age:"+age)return "success"
不修改java调用代码的情况下,你会得到下面异常信息:
ImportError: No module named requests
没错,这就是我要讨论的问题,因为jython不可能涵盖所有python第三方类库的东西,所以在我们得python文件中用到requests类库的时候,很显然会报找不到模块的错误,这个时候我们是可以通过Runtime.getRuntime()开启进程来执行python脚本文件的。
通过Runtime.getRuntime()开启进程来执行脚本文件
使用这种方式需要同时修改python文件以及java调用代码,在此我同样在上面test.py的基础上进行修改:
importrequestsimportsysdefmy_test(name, age):
response= requests.get("http://www.baidu.com")print("url:"+response.url)print("name:"+name)print("age:"+age)return "success"my_test(sys.argv[1], sys.argv[2])
和上面test.py代码最大的区别在于,我们此处开启进程的方式实际上是在隐形的调用dos界面进行操作,因此在python代码中我们需要通过sys.argv的方式来拿到java代码中传递过来的参数。
java调用代码部分:
public static voidmain(String[] args) {
String[] arguments= new String[] {"python", "E:\\workspace\\pycharm_workspace\\weixincrawer\\test.py", "huzhiwei", "25"};try{
Process process=Runtime.getRuntime().exec(arguments);
BufferedReader in= new BufferedReader(newInputStreamReader(process.getInputStream()));
String line= null;while ((line = in.readLine()) != null) {
System.out.println(line);
}
in.close();int re =process.waitFor();
System.out.println(re);
}catch(Exception e) {
e.printStackTrace();
}
}
结果输出:
url:http://www.baidu.com/
name: huzhiwei
age:25
0
在此需要注意的一点,java代码中的process.waitFor()返回值为0表示我们调用python脚本成功,返回值为1表示调用python脚本失败,这和我们通常意义上见到的0与1定义正好相反。
java通过Process.waitFor()调用python模块返回错误代码1的一种解决办法
在本人的实际项目需求开发时,基本上也是模仿上面的思路进行的,python脚本成功在PyCharm Community中也执行也成功,获得了所请求的网页数据,但是在java环境中通过Process.waitFor()调用python模块返回错误代码1。
经过多次尝试和分析,发现
问题原因:我的请求的URL设置为安全Http了,即https了,在PyCharm Community IDE可能存在HTTPS相关的处理模块所以执行成功。但是在java环境中通过Process.waitFor()调用python模块,实质上是通过dos/cmd命令行执行python.exe *.py命令的。而在这种情况下,由于环境中缺少HTTPS相关的处理模块所以执行不成功。
解决办法:将请求的URL由安全Https修改为http即可。
下面附上我的示例代码:
被调用的python代码模块为:
#!/usr/bin/env python#-*- coding: utf-8 -*-#@Time : 2020/3/6 23:41#@Author :#@File : URLibTest.py
importurllib.requestimportsysdefWebSpider(name, age):
response= urllib.request.urlopen('http://celestrak.com/satcat/tle.php?CATNR=25994')print(response.read().decode('utf-8'))
WebSpider(sys.argv[1], sys.argv[2])#WebSpider("huzhiwei", "25")
主调的java代码模块为:
packagecn.cetc;importjava.io.BufferedReader;importjava.io.IOException;importjava.io.InputStreamReader;
public classJavaInvokePython {private static final String pyInterpreterPath = "C:\\Anaconda3\\python.exe";//注意:当命令行参数分开写的时候,exe后面不用添加一个空格。当命令行参数一起写的时候,exe后面一定要添加一个空格
private static final String pyFilePath = "URLibTest.py";//如果未指定.py文件的完全路径,则默认从工程当前目录下搜索
private static Process proc = null;//java进程类
/*** 执行*.py文件*/
public static voidexecPy() {try{
String[] arguments= new String[] {pyInterpreterPath, pyFilePath, "huzhiwei", "25"};//实际上后两个参数传进入也没使用。当真正需要有参数传入时可以是利用这种方式传参
proc=Runtime.getRuntime().exec(arguments);
BufferedReader in= new BufferedReader(newInputStreamReader(proc.getInputStream()));
String line= null;while ((line = in.readLine()) != null) {
System.out.println(line);
}
in.close();int re = proc.waitFor();//返回0:成功。其余返回值均表示失败,如:返回错误代码1:操作不允许,表示调用python脚本失败
System.out.println(re);
}catch(IOException e) {
e.printStackTrace();
}catch(InterruptedException e) {
e.printStackTrace();
}}public static voidmain(String[] args) {
execPy();
}
}
注意:上述java代码运行环境不需要额外安装Jython-x.x.x.jar,只需要一般的JDK环境和常规的需要的包导入。
参考链接: