Jetson AGX Orin的AI性能

silentcr

已于 2024-09-04 17:34:30 修改

阅读量694

点赞数 7

文章标签：人工智能机器学习图像处理视觉检测硬件架构

于 2024-09-04 17:24:55 首次发布

本文链接：https://blog.csdn.net/silentcr/article/details/141897513

版权

在英伟达官网（https://www.nvidia.cn/autonomous-machines/embedded-systems/jetson-orin/）和各处的宣传里，对Jetson AGX Orin 均提到了275T的性能：

在这里插入图片描述

但较少有描述在275T的由来，以至于部分介绍竟然出现了275T的浮点运算：

在这里插入图片描述

而实际上，在官网页面的下方，有一个不起眼的按钮，点击之后，才能看到更加具体的描述：

在这里插入图片描述

弹出窗口如下：
在这里插入图片描述

由图可见，很显然，这275TOPS的性能，仅仅是在INT8下的稀疏矩阵运算（SPARSE)情况下得到的。

在稀疏（SPARSE)且INT8情况下，Tensor Core的性能是170T，加上DLA的105T，正好是275TOPS。

如果是密集（DENSE）情况下，只能达到85+52.5=137.5T的性能，还是INT8的精度。

TensorCore如果进行16位浮点运算（FP16)，还要在INT8的基础上再次腰斩。

看来，对于硬件的宣传的确是加入了相当多的迷惑性。
如果想发挥出硬件的全部性能，算法上还是需要进行相当程度的优化的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

silentcr

关注关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

英伟达Jetson AGX Orin 系列块架构全面解析

weixin_43199439的博客

12-27

659

3. 系统缓存模块NVDLA 是一款针对 AI 深度学习推理任务的高效硬件加速器，特别优化了卷积神经网络的计算路径，凭借其高效的内存管理、低功耗设计和高性能计算，已成为自动驾驶、边缘计算、医疗影像分析等领域的关键技术支撑。视频输入模块在现代自动驾驶、智能座舱、ADAS 和工业自动化等领域中具有重要应用。其高带宽的传输能力、强大的多路同步处理功能以及低延迟设计，使其能够在高性能和高实时性要求的场景中提供可靠的解决方案，为各类高精度视觉系统的实现提供有力支持。

JETSON AGX ORIN配置yolov8运行环境

m0_73100347的博客

01-31

1225

torch版本选择由JetPack版本决定，JetPack 是 NVIDIA 为 Jetson 系列嵌入式计算平台提供的软件开发套件（SDK），输入以下两个命令均可以查看JetPack版本，我的是5.1.2官网不同JetPack版本对应的torch下载链接，我的JetPack版本是5.1.2，所以点击v512即可下载对应pytorch版本。

参与评论您还未登录，请先登录后发表或查看评论

从入门到高阶：Jetson AGX Orin技术参数全解析

weixin_43199439的博客

11-09

3071

如果把设备比作一个工厂，那么 TOPS 就像是工厂的生产能力：数值越高，能处理的数据量越大、越快。但如果你需要更复杂的计算能力，比如实时处理多条车道上的动态物体、实时进行目标跟踪，那就要选择 64GB 版本的 275 TOPS，以保证系统足够流畅和安全。如果需要的是大量实时视频流分析的应用，64GB 的 2048 个 CUDA 核心无疑是更好的选择，可以让计算资源更加丰富。对于需要大量 AI 推理计算的场景，64GB 版本的 NVDLA 加速器更适合，可以保证设备在处理复杂的神经网络时有更好的性能表现。

Jetson AGX Orin配置pytorch+torchvision+tensorrt+pytracking详细流程

m0_51597918的博客

09-04

2324

本文前半部分参考了。

【Nvidia】技术摘要：Nvidia Jetson Agx Orin系列，为机器人技术和边缘人工智能应用带来了巨大的飞跃

静谧、淡雅

04-03

765

Jetson AGX Orin

Jetson AGX Orin 配置LLM Deepseek-R1 7B模型

zengwj2014的博客

03-29

1790

测试环境：硬件： AGX ORIN 32G 套件软件： Jetpack6.2 ，R36.4.3按照官方测试数据，AGX ORIN 64套件可以跑70B 模型，为什么测试7B ，测试机器只有32G 内存套件，图方便直接使用内部64G EMMC 存储，不想麻烦去挂载SSD盘，存储空间大小限制，64G 存储空间刚好只能满足7B模型运行大小。这次采用方式是英伟达官方提供适配测试demo方式，参考链接如下，

Nvidia Jetson AGX Orin

我的博客

06-27

1209

Nvidia Jetson AGX Orin

jetson AGX orin 配置pytorch和cuda使用、yolov8 TensorRt测试

热爱生活，忠于自己

01-06

3565

安装 sudo apt-get install libjpeg-dev zlib1g-dev 之后，删除所有缓存和编译零时文件，再重新编译安装即可。由于gpu推理通常需要预热，拷贝图像（bus.jpg）到文件夹重复多张（以10张为例）即可，重新运行，基本推理耗时。默认安装在系统环境中，若在虚拟环境中，可以创建软连接到虚拟环境中。导出默认的fp32模型，耗时11分钟，40qps，加载测试如下。，执行耗时32分钟（模型文件大小缩小一半），95qps，，如下。若均不报错，且能正常输出说明安装成功，如下图。

Jetson AGX ORIN 初始化&&配置Anaconda&&带CUDA的OpenCV

weixin_52303102的博客

03-22

1680

进行下载（是的，没看错，一个都不行），均显示无法找到对应的包，因此这个方式直接放弃，不过有人如果有需要自己编译的，可以自行在网站下载这些依赖包的源代码，进行编译之后再重新编译。因为是已经编译好的文件，所以直接拿来用就行，具体怎么用呢，就是直接把文件复制到对应的目录就行（基本上大部分的。我是参考一开始的安装连接，安装的。怎么说呢，添加源这个东西可能有帮助，但是感觉帮助不会很大，不一定有用。，将下载的shell文件拷贝至home文件夹，打开终端，输入。确定安装，然后确认安装的路径，一般直接回车安装在默认的。

Jetson AGX Orin手册

04-19

Jetson AGX Orin手册 NVIDIA Jetson AGX Orin是 NVIDIA 推出的最新一代边缘人工智能应用处理器，旨在为机器人和边缘AI应用提供强大的计算能力和高效的能耗管理。本手册概述了Jetson AGX Orin的硬件架构、软件和...

Jetson AGX Orin折腾记

clever101的专栏

02-08

1454

Jetson AGX Orin刷机及安装测试OmniVision-968M模型。

Nvidia Jetson AGX Orin 64G深度学习环境配置

weixin_44659252的博客

11-18

2663

Jetson系列开发板架构是arm64，因此是基于arm64相关的环境配置。

jetson AGX Orin配置虚拟环境anaconda，cuda，pytorch，torchvision后续制作可视化界面pyqt5，pyside6

qq_50771284的博客

04-16

1929

一行一行执行下面代码（注意：第四行是关机，然后重新打开，需要重新进入虚拟环境（我不知道什么时候要进什么时候不要进，索性后面全部命令都在虚拟环境里面执行！这里的python版本跟jetson自带的不冲突，（最好用3.8的版本，别问为什么），接着打开这个虚拟环境，前面括号里的内容会变成自己命名的内容。因为我的cuda是11.4，对应pytorch1.12.0，对应后面的torchvision0.13.0，其他对应版本自己去查。，（注意：jetson系列只能下红框里的，aarch64架构的！

Jetson AGX Orin安装Anaconda，Cuda，Cudnn，pytorch，Tensorrt，ROS

qq_46107892的博客

02-04

1875

Jetson AGX Orin安装Anaconda，Cuda，Cudnn，pytorch，Tensorrt

Jetson AGX Orin 连接自定义硬件设备（pinmux + 设备树）

Pandako's Blog

07-07

8783

在Jetson AGX Orin上接入一块自定义的数据采集板，使用SPI通信接收到数据。我现在有的设备是一台Jetson AGX Orin 和一块采集板，采集板通过Orin的40 pin接口接入。总体来说，主要分为三个步骤：我在安装和配置的过程中，遇到了各种问题，Orin的资料和文档也比较少，以此记录一下=v=引脚复用（Pin Multiplexing），根据Orin的 40 pin GPIO expansion header，为需要的pin打开SPI功能。比如我用的是SPI1，那就需要打开19、21、23

Jetson AGX Orin 配置环境(PyTroch+torchvision）

最新发布

好好学习天天向上的博客

04-07

511

文章末尾参考文献说输入之后总是报错，因此索性不输入了，所以我也没有输入，查了一下发现作用是临时扩展动态库的搜索路径，确保程序运行时能找到所需的 LLVM 8 库文件，我并没有使用这一句export代码，但是记录一下防止以后出错。因为我是没有1.14.0torch版本的对应信息，因此我选择下载2.0.0torch版本对应的0.15.1torchvision版本，根据对应关系选择你需要的。pytorch的whl的源连接，可以根据jetpack的版本找，下载whl文件。中间一直waring。

Jetson AGX ORIN 配置 FGVC-PIM 神经网络（包含 arm64 下面 torch 和 torchvision 配置内容）

weixin_52303102的博客

03-22

799

然后再运行训练数据集的命令，发现可以训练了（这个不打算训练，所以。设置好代码的虚拟环境之后，根据缺少的库的内容，使用。需要的库及其命令如下，不需要找了，可以直接下载。的虚拟环境，之后需要向环境中添加需要的安装包。强行中断了），配置结束！

Jetson AGX Orin安装Anaconda、Cuda、Cudnn

盛世芳华

06-27

5592

拿到一台Jetson AGX Orin，准备搭建AI环境，搭建过程中参考不少文章，也踩了不少坑，特此记录一下。

Jeston AGX Orin 刷机（自记录）

qq_59497090的博客

04-25

2296

（这边可能会报错，有两种，一种烂大街了找下，要是遇到那个什么什么源不能用的，打开九宫格，找到软件与更新，源，把不能用的源去掉就行，照亮好多方法，就这个行！5.长按Orin中间键，松手插上电源，再次长按中间键，再按右边键，松开右边键，松开中间键，使Orin进入恢复模式，选择32GB开发模式。7.看其他教程都是要选手动模式，不知道怎么，我选手动模式flash不了，就选自动模式了，填好账号密码，继续等待。JetPack版本别选那个6.0DP！，选5.1.1（v）那个（前面装不上去就是这个，会报BSP错）

Jetson AGX Orin离线安装jtop文件指南

它能够提供关于Jetson AGX Orin模块的实时性能指标，例如GPU、CPU、内存和存储器使用率。jtop的设计目的是为了让开发者和系统管理员可以更容易地查看和管理Jetson设备的运行状态。 jtop的主要功能包括但不限于以下...

​Jetson AGX Orin的AI性能

Jetson AGX Orin的AI性能