python算法调用方案

1、python算法部署方案

(1)独立部署

算法端和应用端各自独立部署。

使用WSGI(flask)web应用A包装算法,并发布该应用A。
应用端B 通过httpclient调用算法应用A中的api接口。

(2)统一部署

算法模块和应用模块糅合在一起。

应用端和算法模型在一个项目里。
只需在项目中需要使用算法的地方,直接找到算法模块所在目录并加载到内存使用。

2、大数据清洗时,调用python算法的可行方案

(1)独立部署

使用时,大数据应用和算法应用也是独立的。

  • 算法方:把 “使用httpclient调用算法接口” 这部分功能包装在hive/spark udf中。
  • 大数据方:在编写hive/spark sql时,调用hive/spark udf的evaluate(xx)方法,并传递对应参数。

(2)统一部署

使用时,可以把大数据应用和算法应用也统一到同一项目。

先编写python脚本,并在脚本中实现以下功能:

  • 从HDFS/spark中读取数据(加载到内存);
  • 加载算法模型;
  • 用算法处理数据。

再把python脚本部署到GPU服务器上,启动python脚本。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值