9月16日,FATE开源社区第13期圆桌会圆满落幕。本次圆桌会,由FATE团队的资深架构师邓凯老师,为大家介绍FATE的在线组件FATE-Serving2.1.0版本。
接下来带大家回顾经典问答环节,为各位朋友答疑解惑。
问答环节
● Q1:
serving-admin的service那个页面的weight是什么?
● A1:
weight就是权重,是我们在服务治理的时候需要关心的一些问题,比方说一个模型有可能分布在三台机器上,但是三机器的资源是不一样的,可能两台机器资源非常好,一台机器CPU非常弱,这时候需要对流量进行一些分配,可以把那两台的weight分成100,然后这边分成50,那么,比较弱的这台机器分的流量就是1/5。
● Q2:
不用deploy模型吗?
● A2:
deploy模型有。就是我刚才说的 FATE-Flow推模型的时候分成两个步骤,一个是load,一个是bind。
● Q3:
能否借助exchange?
● A3:
exchange是双方不同party之间的一个中间节点,实际上我们会有其他的比这个功能更完善的组件。
比方说,需要考虑到计费、流控、鉴权、路由相关的功能,比现在的exchange要更复杂,是因为本身在线业务就更复杂,它不像是离线传输的都是训练过程中产生的一些数据,而我们在线预测的时候传过去的请求可能每一笔都要计费的。
● Q4:
看代码,guest是会遍历host,把相关信息发给host,是修改了guest合并多个host结果那个阶段吗?
● A4:
实际上我们在做2.0.0的时候就已经为多host预测预留了,所以之前的代码会遍历host,但是模型离线推给在线的时候,模型数据是不支持多host预测的。