java调用scrapy执行爬虫

1 篇文章 0 订阅

网上查了一下,并没有完全讲在java中调用Scrapy框架执行爬虫的示例,其实很简单,了解一下。

前提:

scrapy程序,scrapy运行脚本:

scrapy执行脚本如下(名称为:start.py):

from scrapy import cmdline

cmdline.execute("scrapy crawl 名称 -s LOG_FILE=xx.log".split())

#或者
#cmdline.execute("scrapy crawl 名称".split())

java调用python有好多种方法,本人为了避免导包的麻烦,选择使用Runtime.exec 进行调用python。

调用主要命令如下:

//python脚本的路径
String executePath = path + "\\start.py";
//执行命令Arr
String[] cmdArr = new String[]{"python",executePath};
//参数分别为: 执行命令;执行此脚本的路径
Process process = Runtime.getRuntime().exec(cmdArr,null,new File(path));

接收scrapy中的print打印:

InputStream inputStream = process.getInputStream();
byte[] b = new byte[1024];
while (inputStream.read(b) != -1) {
    writeFilePath = new String(b);
}
//返回linux执行状态码,0为执行正常
int statusNum = process.waitFor();
inputStream.close();

详细可以了解一下Runtime方法。

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值