OpenVINO™ Model Server 使用教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01068/article/details/141382528

OpenVINO™ Model Server 使用教程

model_serverA scalable inference server for models optimized with OpenVINO™项目地址:https://gitcode.com/gh_mirrors/mo/model_server

项目介绍

OpenVINO™ Model Server (OVMS) 是一个高性能的推理服务器，它利用了 Intel 的 OpenVINO™ 工具套件来优化深度学习模型的推理过程。OVMS 支持多种模型格式，并且可以与 Kubernetes 等容器编排系统无缝集成，适用于大规模的模型部署和推理服务。

项目快速启动

安装与部署

首先，确保你的系统已经安装了 Docker。然后，通过以下命令拉取并运行 OVMS 容器：

docker pull openvino/model_server:latest
docker run -d --name ovms -p 9000:9000 openvino/model_server:latest --model_path /path/to/your/model --model_name your_model_name

客户端请求示例

以下是一个使用 Python 客户端向 OVMS 发送推理请求的示例代码：

import grpc
from tensorflow_serving.apis import predict_pb2
from tensorflow_serving.apis import prediction_service_pb2_grpc

channel = grpc.insecure_channel('localhost:9000')
stub = prediction_service_pb2_grpc.PredictionServiceStub(channel)

request = predict_pb2.PredictRequest()
request.model_spec.name = 'your_model_name'
request.inputs['input_name'].CopyFrom(
    tf.make_tensor_proto(your_input_data, shape=your_input_shape))

response = stub.Predict(request, 10.0)  # 10 secs timeout
print(response)