在Jetson TX2 上测试 Tensorflow、pytorch 模型的推理性能 —— 从入门到tensorrt加速

最新推荐文章于 2024-01-19 08:39:26 发布

我写bug贼6

最新推荐文章于 2024-01-19 08:39:26 发布

阅读量912

点赞数 1

分类专栏： deep learning 文章标签： tensorflow pytorch 深度学习 python

本文链接：https://blog.csdn.net/weixin_42252533/article/details/114144202

版权

deep learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在Jetson TX2 上安装 Tensorflow or pytorch 并利用 Tensorrt 加速

Jetson TX2 是什么？

在这里插入图片描述
一块嵌入式开发板，不是x86架构，而是ARM架构，这是造成 Anaconda、tensorflow、pytorch之类安装有困难的重要原因。

既然架构不同，那当然有不同的安装包，这也是我要记录、分享的主要内容。

Tensorflow/Pytorch Install

以下就是环境管理和包管理神器Anaconda、深度学习明星框架 tensorflow 以及后起之秀pytorch的安装包地址：

for Archiconda:
	
	 - https://github.com/Archiconda/build-tools/releases 
	 
	for Pytorch:
	
	 - https://forums.developer.nvidia.com/t/pytorch-for-jetson-version-1-7-0-now-available/72048
	
	for Tensorflow
	
	 -  https://forums.developer.nvidia.com/t/tensorflow-for-jetson-tx2/64596#527861
	 -  https://developer.nvidia.com/embedded/downloads#?search=TensorFlow

Tensorrt Test

下面利用 tensorrt 对自己的tensorflow模型或者pytorch模型进行加速：

tensorflow example:

这是一个pb模型加速的例子，环境是 tf1.15。

import tensorflow as tf
from tensorflow.python.compiler.tensorrt import trt_convert as trt
import numpy as np
import time

with tf.Session() as sess:
    # First deserialize your frozen graph:
    with tf.gfile.GFile('epoch011--train34.6693_hmp27.0977.pb', 'rb') as f:
        frozen_graph = tf.GraphDef()
        frozen_graph.ParseFromString(f.read())
    # Now you can create a TensorRT inference graph from your
    # frozen graph:
    converter = trt.TrtGraphConverter(input_graph_def=frozen_graph,
                                          nodes_blacklist=['heatmaps/Reshape', 'skeletons/Reshape'],
                                          precision_mode='FP16',
                                          is_dynamic_op=True)
    trt_graph = converter.convert()
    # Import the TensorRT graph into a new graph and run:
    output_node = tf.import_graph_def(
              trt_graph,
              return_elements=['heatmaps/Reshape', 'skeletons/Reshape'])

    # add 'import/'
    input = sess.graph.get_tensor_by_name('import/input_layer:0')
    heatmaps = sess.graph.get_tensor_by_name('import/heatmaps/Reshape:0')
    skeletons = sess.graph.get_tensor_by_name('import/skeletons/Reshape:0')
    print(type(heatmaps))
    t=0
    for i in range(300):
        image_cropped =  np.random.randn(1, 256,256, 3)
        t1 = time.time()
        (heatmaps_out,skeletons_out) = sess.run([heatmaps,skeletons], {input: image_cropped})
        t2 = time.time()
        t3 = t2-t1
        if i>=100:
            t += t3
    print('avg_time:',t/200)
    print('FPS:', str(200/t))
    print('ms:', str(1000*t/200))

Result

result

Pytorch example:

https://github.com/NVIDIA-AI-IOT/torch2trt

我写bug贼6

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
在Jetson TX2 上测试 Tensorflow、pytorch 模型的推理性能 —— 从入门到tensorrt加速

TX2 Tensorflow Tensorrt Tensorflow/Pytorch InstallTensorrt TestResultTensorflow/Pytorch Installfor Archiconda:https://github.com/Archiconda/build-tools/releasesfor Pytorch:https://forums.developer.nvidia.com/t/pytorch-for-jetson-version-1-7-0-now
复制链接

扫一扫