tensorflow serving中enable_model_warmup在部署中的使用

最新推荐文章于 2022-09-30 00:35:02 发布

醉意流年go

最新推荐文章于 2022-09-30 00:35:02 发布

阅读量985

点赞数

分类专栏： tensorflow 工具 python 文章标签： tensorflow python

本文链接：https://blog.csdn.net/u010626747/article/details/106612055

版权

tensorflow 同时被 3 个专栏收录

25 篇文章 0 订阅

订阅专栏

python

15 篇文章 0 订阅

订阅专栏

工具

3 篇文章 0 订阅

订阅专栏

enable_model_warmup参数：在tensorflow serving中通过saved_model模型中自带客户端的请求来预加载模型，减少第一次的请求的延迟

命名：在saved_model模型文件夹下的asserts.extra文件夹，放入命名为tf_serving_warmup_requests的tf record文件即可

其中assets.extra文件下：

# coding:utf-8

# @author: “”
# @file: tf_serving_warmup_requests_client.py
# @time:
# @desc:





import tensorflow as tf

from tensorflow_serving.apis import predict_pb2
from tensorflow_serving.apis import prediction_log_pb2

request_dict = {'inputs': {'input_ids': [[101, 2644, 1962, 8024, 6821, 7027, 3221, 1921, 1921, 2864, 6756, 8024, 1744, 1079, 3297, 1920, 4638, 757, 5468, 5381, 1297, 6756, 2398, 1378, 8024, 6435, 7309, 2644, 4385, 1762, 3221, 3300, 6775, 6756, 7444, 6206, 1139, 1545, 1408, 8043, 172, 3300, 702, 6756, 1762, 1297, 102, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 'input_mask': [[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 'segment_ids': [[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 'is_training': False}, 'signature_name': 'serving_default'}

input_ids = request_dict["inputs"]["input_ids"]
input_mask = request_dict["inputs"]["input_mask"]
segment_ids = request_dict["inputs"]["segment_ids"]
is_training = request_dict["inputs"]["is_training"]

print(input_ids)


with tf.io.TFRecordWriter("tf_serving_warmup_requests") as writer:
    predict_request = predict_pb2.PredictRequest()
    predict_request.model_spec.name = "sellcarintent_models"  ### 对应tf serving中的MODEL_NAME
    predict_request.model_spec.signature_name = "serving_default"   # 这个是预测签名, serving_default
    predict_request.inputs["input_ids"].CopyFrom(tf.make_tensor_proto(input_ids, tf.int32))
    predict_request.inputs["input_mask"].CopyFrom(tf.make_tensor_proto(input_mask, tf.int32))
    predict_request.inputs["segment_ids"].CopyFrom(tf.make_tensor_proto(segment_ids, tf.int32))
    predict_request.inputs["is_training"].CopyFrom(tf.make_tensor_proto(is_training, tf.bool))

    # log = prediction_log_pb2.PredictLog(request=predict_request)
    log = prediction_log_pb2.PredictionLog(predict_log=prediction_log_pb2.PredictLog(request=predict_request))
    for i in range(100):
        writer.write(log.SerializeToString())

醉意流年go

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
tensorflow serving中enable_model_warmup在部署中的使用

enable_model_warmup参数：在tensorflow serving中通过saved_model模型中自带客户端的请求来预加载模型，减少第一次的请求的延迟命名：在saved_model模型文件夹下的assert.extra文件夹，放入命名为tf_serving_warmup_requests的tf record文件即可# coding:utf-8# @author: “”# @file: tf_serving_warmup_requests_client.py# @ti.
复制链接

扫一扫

专栏目录