自学C语言能去英伟达吗,$AMD(AMD)$ 坛子里有人对 英伟达 的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器... - 雪球...

博客讨论了AMD显卡与英伟达CUDA的性能对比,指出AMD Radeon VII在某些测试中仅比RTX 2080 Ti慢10%,在FP16运算中甚至更接近。尽管英伟达的CUDA生态系统更为成熟,但AMD的ROCm在持续优化中,两者之间的竞争日益激烈。
摘要由CSDN通过智能技术生成

来源:雪球App,作者: 胡歌胡歌,(https://xueqiu.com/4961234302/140181275)$AMD(AMD)$ 坛子里有人对英伟达的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器科学计算进行了长期的优化。老黄在十五六年前就开始在这方面努力 结果AI的到来帮助英伟达打开了一个巨大的市场。事实上Amd 的显卡计算能力一直都比英伟达强一个数量级。好比rx580完虐1060 这两张卡在发行时 1060凭借dx11A黑游戏遥遥领先。到了现在随着dx12 Vulkan的来临1060已经到了尾声。此时580还是当红炸子鸡,当前最高级的大镖客2 580是完美适配。苏妈因为没钱 所以ROCM投的钱有限 生态搞不过英伟达。不过这两年进步非常明显。vega7和2080ti 的tensorflow training 对比 也就慢了10%。不信看看下面的数据。最可怕的是 rocm一直都在慢慢的优化 每次比上一次都更快。显卡战争随着才刚刚开始。

TensorFlow 1.14.4

git clone 网页链接 --recursive

python lambda-tensorflow-benchmark/benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --optimizer=sgd --model=resnet50 --num_gpus=1 --batch_size=64 --variable_update=replicated --distortions=false --num_batches=10000 --data_name=imagenet

FP32

- NVIDIA GTX 1080 Ti: ~215 images/sec

- NVIDIA RTX 2080 Ti: ~300 images/sec

- NVIDIA TITAN RTX: ~320 images/sec

- NVIDIA Tesla V100: ~383 images/sec

- AMD Radeon VII: ~275 images/sec

FP16

- NVIDIA GTX 1080 Ti: ~277 images/sec

- NVIDIA RTX 2080 Ti: ~495 images/sec

- NVIDIA TITAN RTX: ~518 images/sec

- NVIDIA Tesla V100: ~725 images/sec

- AMD Radeon VII: ~373 images/sec

So in FP32 for this ResNet50 benchmark the Radeon VII is about 9-10% slower than the 2080 Ti and about 25-30% faster than the 1080 Ti.

In FP16 it is 25% slower than the 2080 Ti and 35% faster than the 1080 Ti.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值