​Jetson AGX Orin的AI性能



在英伟达官网(https://www.nvidia.cn/autonomous-machines/embedded-systems/jetson-orin/)和各处的宣传里,对Jetson AGX Orin 均提到了275T的性能:

在这里插入图片描述


但较少有描述在275T的由来,以至于部分介绍竟然出现了275T的浮点运算

在这里插入图片描述


而实际上,在官网页面的下方,有一个不起眼的按钮,点击之后,才能看到更加具体的描述:

在这里插入图片描述


弹出窗口如下:
在这里插入图片描述


由图可见,很显然,这275TOPS的性能,仅仅是在INT8下稀疏矩阵运算SPARSE)情况下得到的。

稀疏SPARSE)且INT8情况下,Tensor Core的性能是170T,加上DLA105T,正好是275TOPS

如果是密集DENSE)情况下,只能达到85+52.5=137.5T的性能,还是INT8的精度。

TensorCore如果进行16位浮点运算(FP16),还要在INT8的基础上再次腰斩。

看来,对于硬件的宣传的确是加入了相当多的迷惑性。
如果想发挥出硬件的全部性能,算法上还是需要进行相当程度的优化的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值