AI模型推理(3)——ModelMesh使用

参考:

ModelMesh installation - KServe Documentation Website

ModelMesh Overview - KServe Documentation Website

前言

Kserve提供了“Serverless”和“ModelMesh”两种安装模式。其中Serverless是通过Knative组件实现动态扩缩容等功能。而ModelMesh则是另一种资源开销较小的模式。

意义

按照通常的 AI 部署方案,不同的模型需要运行在不同的模型运行时(runtime)下,多模型部署需要维护大量不同模型运行时 起的服务。

 而使用ModelMesh模式,让可以在一个模型运行时运行的模型,部署在一个Pod上,不用造成Pod、IP资源的浪费。

ModelMesh架构

从上图可以看到ModelMesh 主要由三个模块构成:

  1. ModelMesh serve。ModelMesh CR的调谐模块
  2. ModelMesh。运行在Runtime Deployment Pod里面,用于调谐模型加载的位置,以及路由推理API请求。
  3. ModelMesh runtime adapter。运行在Runtime Deployment Pod里面,在上图的Puller位置,用于适配不同的model runtime。

入门使用

首先,用户的namespace需要打上标签:

[root@node-1 working]# k get ns --show-labels chenxy
NAME     STATUS   AGE   LABELS
chenxy   Active   66d   kubernetes.io/metadata.name=chenxy,modelmesh-enabled=true

创建ServingRuntime:

[root@node-1 working]# k get servingruntime -n chenxy
NAME           DISABLED   MODELTYPE     CONTAINERS   AGE
mlserver-0.x              sklearn       mlserver     66d
ovms-1.x                  openvino_ir   ovms         66d
triton-2.x                keras         triton       66d

在ServingRuntime里,有设置runtime的镜像:

 以及runtime占用的资源:

 还有runtime支持的model type:

 创建完后,可以看到有一个对应的deployment生成:

 在没有model部署在相应的 runtime 的时候,这个deployment 是不启动pod的,当相应的runtime上创建一个InferenceService:

等待资源创建成功

 再看runtime deployment,就会发现已经有 pod 起来了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【⼈⼯智能】不确定性推理⽅法——C-F模型 ⽂章⽬录 ⼀. 基本概念 要掌握C-F模型⾸先需要了解可信度的概念,可信度是根据经验对⼀个事物或现象为真的相信程度,说⽩了就是有多⼤把握相信⼀个事情。 由于可信度不可避免地带有较⼤主观性和经验性,难以把握准确性。C-F模型便是基于可信度表⽰的不确定性推理的基本⽅法。 不确定性推理主要有两种不确定性,即关于知识的不确定性和关于证据的不确定性。 C-F模型中关于知识的不确定性的表⽰⽅法为"IF E THEN H (CF(H,E))"。这样的式⼦后⾯的括号中都会有⼀个数值,这个数值叫可信度 因⼦,它的取值范围为[-1,1]。可信度因⼦⼜被称为静态强度,即当E所对应的证据为真时对H的影响程度。 若CF(H,E) > 0,CF(H,E)的值越⼤,则证据的出现越是⽀持H为真;若CF(H,E) < 0,CF(H,E)的值越⼩,则证据的出现越是⽀持H为假; 若CF(H,E)=0,则证据的出现与否与H⽆关。 C-F模型中关于证据的不确定性的表⽰⽅法为"CF(E)",CF(E)的值便是证据E的可信度,它的取值范围为[-1,1]。可信度⼜被称为动态强 度,即证据E当前的不确定性程度。 对于初始证据,若所有观察S能肯定它为真,则CF(E) = 1。若肯定它为假,则CF(E) = -1。若以某种程度为真,则 0 < CF(E) < 1。若以某 种程度为假,则 -1 < CF(E) < 0 。若未获得任何相关的观察,则 CF(E) = 0。 ⼆. 必背公式 上⾯这些基本概念是不是看着⼀头雾⽔? 没错,确实很抽象,但是这并不妨碍我们把题做出来,咱们真正需要重点掌握的是接下来的公式。 就硬背,⼲就完了! 1. 证据不确定性的组合算法 组合证据按照逻辑运算与(AND)和或(OR)可以分为合取运算和析取运算,其公式如下: 合取运算: 析取运算: 记忆⼝诀:合取AND取最⼩,析取OR取最⼤。 2. 结论不确定性的传递算法 C-F模型中的不确定性推理从不确定的初始证据出发,最终推出结论并求出结论的可信度值。结论 H 的可信度的计算公式如下: 3. 结论不确定性的合成算法 上⾯这个算法只是假定只有两个因素E1和E2对H有影响,对于多个因素(两个以上)对H有影响的情况,需要先根据上述算法合成 CF1,2(H),再与后⾯的项CF3(H)合成CF1,2,3(H),直⾄遍历完所有对H有影响的因素。需要注意的是在算法的第⼆步需要根据合成⼆者 的符号选⽤特定的公式。 三. 典型例题 我们现在已经背会了上⾯三个算法公式,现在就可以开始做题了。 下⾯给出了三道例题,我们可以通过例题的分析求解总结出C-F模型相关题⽬的普遍性解法。 例题1 【例1】设有如下⼀组知识: r1:IF E1 THEN H (0.9) r2:IF E2 THEN H (0.6) r3:IF E3 THEN H (-0.5) r4:IF E4 AND (E5 OR E6) THEN E1(0.8) 已知CF(E2) = 0.8,CF(E3) = 0.6, CF(E4) = 0.5,CF(E5) = 0.6,CF(E6) = 0.8 ,求CF(H)。 我们⾸先观察已知的内容,发现有CF(E2)、CF(E3)、CF(E4)、CF(E5)和CF(E6),是不是感觉缺少了些东西? 对啊!CF(E1)哪⼉去了!? 其实,CF(E1)这个东西就是我们⾸先需要求出来的值,是本题的⼊⼝所在。 我们从上⾯的四条知识中搜寻E1,发现r4这句中带有E1,我们便需要根据此条知识求出CF(E1)。 根据不确定性传递算法,我们可以将r4这句转化为下⾯这个样⼦: CF(E1) = 0.8 × max{0, CF[E4 AND (E5 OR E6)]} 我们重点关注⼀下"CF[E4 AND (E5 OR E6)]",这个式⼦中带有AND和OR,我们很⾃然地就想到了合取和析取运算,运⽤记忆⼝诀, 我们可以进⼀步处理可以得到下⾯这个样⼦: CF(E1) = 0.8 × max{0, min{CF(E4), max{CF(E5), CF(E6)}}} 然后代⼊已知的值进⾏计算: CF(E1) = 0.8 × max{0, min{0.5, max{0.6, 0.8}}} = 0.4 CF(E1) = 0.4总算被我们求出来了,现在我们再观察上⾯三个和H有关的知识r1、r2、r3。 r1:IF E1 THEN H (0.9) r2:IF E2 THEN H (0.6) r3:IF E3 THEN H (-0.5) 从上式我们可以得知,有三个因素E1、E2、E3都对H有影响。为了求出CF(H),此时我们应该先合成CF1,2(H),再与CF3(H)合成 CF1,2,3(H)。 先将r1、r2、r3转化,并计算出C

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值