TensorFlow训练好的模型移植到tensorrt

最新推荐文章于 2024-08-03 03:24:52 发布

songsongL

最新推荐文章于 2024-08-03 03:24:52 发布

阅读量2k

点赞数

分类专栏： Python 文章标签： tensorflow 深度学习 tensorrt

本文链接：https://blog.csdn.net/songsongL/article/details/115217718

版权

Python 专栏收录该内容

14 篇文章 1 订阅

订阅专栏

应用场景

需要把深度学习模型搭载到无人机上完成一些探测任务。
大疆妙算上预装了tensorrt4，打算将TensorFlow训练好的模型搭载上去。

tensorrt

tensorrt是个推理阶段的加速框架，支持一些层的操作，不是所有的层（比如dropout），不过也可以自定义没有的op(算子)，它支持caffe、TensorFlow等。

TensorFlow=> tensorrt

用TensorFlow训练保存的模型一般为ckpt的，把他转为tensorrt支持的操作是：

ckpt=>pb=>uff

注意：这个过程需要TensorFlow计算图的输入和输出的名字。

X = tf.placeholder(tf.float32, [None, 784], name='x-input')  
# name就是自己起的名字，不起的话，TensorFlow会自己起

这个代码可以看有哪些节点，一般，第一个就是输入的名字，softmax或者输出层那里就是输出的名字，可以对着代码看一看。

def getinout(input_checkpoint):
    saver = tf.train.import_meta_graph(input_checkpoint + '.meta', clear_devices=True)
    graph = tf.get_default_graph()
    input_graph_def = graph.as_graph_def()
    with tf.Session() as sess:
        file = open('./nodes.txt', 'a+')

        for n in tf.get_default_graph().as_graph_def().node:
            file.write(n.name + '\n')

        file.close()

这个代码可以将ckpt转为pb。

def freeze_graph(input_checkpoint, output_graph):
    '''
    :param input_checkpoint:
    :param output_graph: PB模型保存路径
    :return:
    '''
    # checkpoint = tf.train.get_checkpoint_state(model_folder) #检查目录下ckpt文件状态是否可用
    # input_checkpoint = checkpoint.model_checkpoint_path #得ckpt文件路径

    # 指定输出的节点名称,该节点名称必须是原模型中存在的节点
    output_node_names = "Softmax"
    saver = tf.train.import_meta_graph(input_checkpoint + '.meta', clear_devices=True)

    with tf.Session() as sess:
        saver.restore(sess, input_checkpoint)  # 恢复图并得到数据
        output_graph_def = tf.graph_util.convert_variables_to_constants(  # 模型持久化，将变量值固定
            sess=sess,
            input_graph_def=sess.graph_def,  # 等于:sess.graph_def
            output_node_names=output_node_names.split(","))  # 如果有多个输出节点，以逗号隔开

        with tf.gfile.GFile(output_graph, "wb") as f:  # 保存模型
            f.write(output_graph_def.SerializeToString())  # 序列化输出
        print("%d ops in the final graph." % len(output_graph_def.node))  # 得到当前图有几个操作节点

这个代码可以加载pb测试

import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow.examples.tutorials.mnist import input_data
import numpy as np
import uff

# 下载数据集 数字1到10
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

def freeze_graph_test(pb_path):
    '''
    :param pb_path:pb文件的路径
    :param image_path:测试图片的路径
    :return:
    '''
    with tf.Graph().as_default():
        output_graph_def = tf.GraphDef()
        with open(pb_path, "rb") as f:
            output_graph_def.ParseFromString(f.read())
            tf.import_graph_def(output_graph_def, name="")
        with tf.Session() as sess:
            sess.run(tf.global_variables_initializer())

            # 定义输入的张量名称,对应网络结构的输入张量
            # input:0作为输入图像,keep_prob:0作为dropout的参数,测试时值为1,is_training:0训练参数
            input_image_tensor = sess.graph.get_tensor_by_name("x-input:0")
            # 定义输出的张量名称
            output_tensor_name = sess.graph.get_tensor_by_name("Softmax:0")

            # 读取测试图片，num可以随便改
            # THIS WILL LOAD ONE TRAINING EXAMPLE
            num = 600
            x_train = mnist.test.images[num , :].reshape(1, 784)
            y_train = mnist.test.labels[num , :]

            np.set_printoptions(precision=1)
            np.set_printoptions(suppress=True)
            # THIS GETS OUR LABEL AS A INTEGER
            label = y_train.argmax()
            
            out = sess.run(output_tensor_name, feed_dict={input_image_tensor: x_train})
            print("out:{}".format(out))
            score = tf.nn.softmax(out, name='pre')
            class_id = tf.argmax(score, 1)
            print("pre class_id:{}".format(sess.run(class_id)))
            # plt.title('Prediction: %d Label: %s' % (1, label))
            plt.imshow(x_train.reshape([28, 28]), cmap=plt.get_cmap('gray_r'))
            plt.show()


if __name__ == '__main__':
    # 输出pb模型的路径
    out_pb_path = "models/frozen_model.pb"

    freeze_graph_test(pb_path=out_pb_path)

可视化模型
在线可视化模型,导入ckpt或者pb就可以看类似流程图的计算图。

在这里插入图片描述
这是pb的图，比ckpt简洁太多了！

pb=>uff

教程说是用tensorrt带的convert-to-uff就转了。。。我TM找了半天根本没有，后来也发现秒算上的tensorrt根本就没有Python模块，都是c++的API。
解决：
英伟达官网下载了一个win10的tensorrt7，
在这里插入图片描述
这里面有两个轮子，安装好之后，去uff的安装目录下就会有convert_to_uff.py文件

(tf-gpu) D:\Anaconda\envs\tf-gpu\Lib\site-packages\uff\bin>python convert_to_uff.py frozen_model.pb

这样就有了uff文件了。

tensorrt样例

tensorrt下的samples里有加载TensorFlow模型的样例sampleUffMNIST。改一改里面加载uff文件的cpp代码基本就行了。
就在这个目录下make一下，就会在tensorrt的bin目录下生成可执行的文件了。
跑一下，试一试成功没有：

--------------------------



@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@+  :@@@@@@@@
@@@@@@@@@@@@@@%= :. --%@@@@@
@@@@@@@@@@@@@%. -@= - :@@@@@
@@@@@@@@@@@@@: -@@#%@@ #@@@@
@@@@@@@@@@@@: #@@@@@@@-#@@@@
@@@@@@@@@@@= #@@@@@@@@=%@@@@
@@@@@@@@@@= #@@@@@@@@@:@@@@@
@@@@@@@@@+ -@@@@@@@@@%.@@@@@
@@@@@@@@@::@@@@@@@@@@+-@@@@@
@@@@@@@@-.%@@@@@@@@@@.*@@@@@
@@@@@@@@ *@@@@@@@@@@@ *@@@@@
@@@@@@@% %@@@@@@@@@%.-@@@@@@
@@@@@@@:*@@@@@@@@@+. %@@@@@@
@@@@@@# @@@@@@@@@# .*@@@@@@@
@@@@@@# @@@@@@@@=  +@@@@@@@@
@@@@@@# @@@@@@%. .+@@@@@@@@@
@@@@@@# @@@@@*. -%@@@@@@@@@@
@@@@@@# ---    =@@@@@@@@@@@@
@@@@@@#      *%@@@@@@@@@@@@@
@@@@@@@%: -=%@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
10 eltCount
--- OUTPUT ---
0 => 3.41521	 : ***
1 => -11.118	 : 
2 => -2.60688	 : 
3 => -5.37433	 : 
4 => -14.5769	 : 
5 => -0.0877042	 : 
6 => -1.25683	 : 
7 => -11.7811	 : 
8 => -5.30992	 : 
9 => -8.00871	 : 




---------------------------



@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@+ @@@@@@@@@@@@@@
@@@@@@@@@@@@. @@@@@@@@@@@@@@
@@@@@@@@@@@@- @@@@@@@@@@@@@@
@@@@@@@@@@@#  @@@@@@@@@@@@@@
@@@@@@@@@@@#  *@@@@@@@@@@@@@
@@@@@@@@@@@@  :@@@@@@@@@@@@@
@@@@@@@@@@@@= .@@@@@@@@@@@@@
@@@@@@@@@@@@#  %@@@@@@@@@@@@
@@@@@@@@@@@@% .@@@@@@@@@@@@@
@@@@@@@@@@@@%  %@@@@@@@@@@@@
@@@@@@@@@@@@%  %@@@@@@@@@@@@
@@@@@@@@@@@@@= +@@@@@@@@@@@@
@@@@@@@@@@@@@* -@@@@@@@@@@@@
@@@@@@@@@@@@@*  @@@@@@@@@@@@
@@@@@@@@@@@@@@  @@@@@@@@@@@@
@@@@@@@@@@@@@@  *@@@@@@@@@@@
@@@@@@@@@@@@@@  *@@@@@@@@@@@
@@@@@@@@@@@@@@  *@@@@@@@@@@@
@@@@@@@@@@@@@@  *@@@@@@@@@@@
@@@@@@@@@@@@@@* @@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@@@@@@@@@@@@@@@@@@@@@@@@@@@@
10 eltCount
--- OUTPUT ---
0 => -10.9159	 : 
1 => 3.85835	 : ***
2 => -5.38455	 : 
3 => -3.43404	 : 
4 => -5.66351	 : 
5 => -5.13578	 : 
6 => -3.38536	 : 
7 => -7.77694	 : 
8 => -0.558315	 : 
9 => -4.30673	 : 




---------------------------

这样，自己训练的TensorFlow模型就能在无人机上跑起来了！