tensorflow模型在更新的一瞬间容易产生超时, tf-serving 中的warmup主要是通过模型启动时加载model/assets.extra/tf_serving_warmup_requests达到热启动的目的,使得模型更新时不易产生超时的问题
本文主要是讲解 tf_serving_warmup_requests的生成和反解析的过程,同时由于有些模型不需要训练,在已有模型的基础上,获取旧模型的warmup的特征,并手动给部分新特征进行预热,能够减少手动构造全部特征进行预热的繁琐工作
生成tensoflow2 tf_serving_warmup_requests 文件
def gen_warmup_file():
extra_path = 'tt/assets.extra/tf_serving_warmup_requests'
feature={
'a':tf.constant([[20,20],[89,90]],dtype=tf.int32),
'b':tf.constant([