tensorflow serving 的相关知识

会发paper的学渣

已于 2023-03-22 16:42:22 修改

阅读量235

点赞数 1

分类专栏： tensorflow2.x 深度学习基础文章标签： tensorflow 人工智能 python Powered by 金山文档

于 2023-01-09 18:20:21 首次发布

本文链接：https://blog.csdn.net/sslfk/article/details/128618811

版权

tensorflow2.x 同时被 2 个专栏收录

39 篇文章 0 订阅

订阅专栏

深度学习基础

24 篇文章 4 订阅

订阅专栏

关于部署方面，建议使用官方的docker方式：https://github.com/tensorflow/serving

单模型部署时，

执行命令如下：

docker run -t --rm -p 8501:8501 \
    -v "/home/tensorflow_serving/first_test:/models/first_test" \
    -e MODEL_NAME=first_test \
    tensorflow/serving &

其中，关于/home/tensorflow_serving/first_test的目录结构如下：

first_test
  1
    assets
    variables
    fingerprint.pb
    keras_metadata.pb
    saved_model.pb
  2
    assets
    variables
    fingerprint.pb
    keras_metadata.pb
    saved_model.pb

其中1/2等为对应的版本信息，必须为数字，tensorflow会按照数字大小排序，自动更新为最新版本的模型进行自动化部署

模型请求方面

例如模型代码如下：

import tensorflow as tf

input3 = tf.keras.layers.Input(shape=(1,),name="string_test",dtype=tf.string)
my_string_lookup = tf.keras.layers.StringLookup(vocabulary=["世界","你","good", "d"])(input3)
model = tf.keras.Model(inputs=[input3], outputs=my_string_lookup)

通过tensorflow-serving部署启动后，对应的客户端请求方式为：

方式1-按行请求：

POST --header 'Content-Type: application/json' http://IP:8501/v1/models/first_test:predict
{
    "instances": [
        {
            "string_test": "世界"
        }
    ]
}

方式2:-按列请求：

POST --header 'Content-Type: application/json' http://IP:8501/v1/models/first_test:predict
{
    "inputs": {
        "string_test": [
            "世界",
            "你",
            "good",
            "e"
        ]
    }
}