说明
关于Tensorflow的使用与模型生成,谷歌推荐的保存模型为PB文件,因为它具有语言独立性,可独立运行,封闭的序列化格式,任何语言都可以解析它,因此也就允许其他语言进行开发对接。本文就以一个简单案例的方式来说明模型的生成和调用。
Tensorflow生成逻辑回归模型,模型保存为二进制PB文件
本文所有的案例是一个逻辑回归模型,y=wx+b。训练与生成模型的代码如下所示:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.python.framework import graph_util
## -1到1之间随机数 100个
train_X = np.linspace(-1, 1, 100)
train_Y = 2*train_X + np.random.randn(*train_X.shape)*0.1
# 显示模拟数据点
plt.plot(train_X, train_Y, 'ro', label='test')
plt.legend()
plt.show()
# 创建模型
# 占位符
X = tf.placeholder("float",name='X')
Y = tf.placeholder("float",name='Y')
# 模型参数
# W初始化为-1到1之间的一个数字
W = tf.Variable(tf.random_normal([1]), name="weight")
# b初始化为0 也是一维 定义变量
b = tf.Variable(tf.zeros([1]), name="bias")
# 前向结构 mulpiply两个数 相乘
z = tf.multiply(X, W) + b
op = tf.add(tf.multiply(X, W),b,name='results')
# 反向优化
cost = tf.reduce_mean(tf.square(Y - z))
learning_rate = 0.01
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
# 初始化所有变量
init = tf.global_variables_initializer()
# 定义参数
training_epochs = 20
display_step = 2
def moving_avage(a, w=10):
if len(a) < w:
return a[:]
return [val if idx<w else sum(a[(idx-w):idx])/w for idx, val in enumerate(a)]
saver = tf.train.Saver()
# 启动session
with tf.Session() as sess:
sess.run(init)
# 存放批次值和损失值
plotdata = {"batchsize": [], "loss": []}
# 向量模型输入数据
for epoch in range(training_epochs):
for(x, y) in zip(train_X, train_Y):
sess.run(optimizer, {X:x, Y:y})
# 显示训练中的详细信息
if epoch % display_step == 0:
loss = sess.run(cost, {X:train_X, Y:train_Y})
print("Epoch:", epoch+1, "cost=", loss, "W=", sess.run(W), "b=",sess.run(b))
if not (loss == "NA"):
plotdata["batchsize"].append(epoch)
plotdata["loss"].append(loss)
print("Finished!")
#保存模型
saver.save(sess, "model/first")
print("cost =", sess.run(cost, feed_dict={X:train_X, Y:train_Y}), "W=", sess.run(W), "b=", sess.run(b))
const_graph = graph_util.convert_variables_to_constants(sess, sess.graph_def,["results"])
with tf.gfile.FastGFile("model/first.pb",mode='wb') as f:
f.write(const_graph.SerializeToString())
# 图形显示
plt.plot(train_X, train_Y, 'ro', label='Original data')
plt.plot(train_X, sess.run(W)*train_X+sess.run(b),label='Filttedline')
plt.legend()
plt.show()
plotdata["avgloss"] = moving_avage(plotdata["loss"])
# plt.figure(1)
plt.subplot(211)
plt.plot(plotdata["batchsize"],plotdata["avgloss"], 'b--')
plt.xlabel('Minibatch number')
plt.ylabel('Loss')
plt.title('Minibatch run vs, Trainging loss')
plt.show()
print("x=0.2, z=", sess.run(z, {X:0.2}))
- 具体此处不作解释:主要就是一个训练与生成模型过程,重点是对于生成的模型输出为PB格式,并给出输入输出变量的名称定义。
python调用
采用Python调用模型并测试,具体代码如下所示:
from tensorflow.python.platform import gfile
import tensorflow as tf
sess = tf.Session()
with gfile.FastGFile('model/first.pb','rb') as f:
graph_def = tf.GraphDef()
graph_def.ParseFromString(f.read())
sess.graph.as_default()
tf.import_graph_def(graph_def,name='')
sess.run(tf.global_variables_initializer())
print(sess.run('weight:0'))
print(sess.run('bias:0'))
input_x = sess.graph.get_tensor_by_name('X:0')
op = sess.graph.get_tensor_by_name('results:0')
ret = sess.run(op, feed_dict={input_x: 2})
print(ret)
java调用
Java代码调用实现如下所示:
try(Graph graph = new Graph()){
byte[] graphBytes = IOUtils.toByteArray(new FileInputStream("model/first.pb"));
graph.importGraphDef(graphBytes)
try(Session session = new Session(graph)){
Tensor<?> out = session.runner()
.feed("X",Tensor.create(2.0f))
.fetch("results").run().get(0);
float[] r = new float[1];
out.copyTo(r);
System.out.println(r[0]);
}
}
- 最后需要注意的是,在创建模型的时候一定要定义好输入与输出变量名称,这是在后续模型调用过程中是要一一对应的。
若文章对你有用请打赏: