自学C语言能去英伟达吗,$AMD(AMD)$ 坛子里有人对英伟达的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器... - 雪球...

最新推荐文章于 2022-09-18 15:49:26 发布

AIWorldLabs

最新推荐文章于 2022-09-18 15:49:26 发布

阅读量123

点赞数

文章标签：自学C语言能去英伟达吗

博客讨论了AMD显卡与英伟达CUDA的性能对比，指出AMD Radeon VII在某些测试中仅比RTX 2080 Ti慢10%，在FP16运算中甚至更接近。尽管英伟达的CUDA生态系统更为成熟，但AMD的ROCm在持续优化中，两者之间的竞争日益激烈。

摘要由CSDN通过智能技术生成

来源：雪球App，作者：胡歌胡歌，(https://xueqiu.com/4961234302/140181275)$AMD(AMD)$ 坛子里有人对英伟达的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器科学计算进行了长期的优化。老黄在十五六年前就开始在这方面努力结果AI的到来帮助英伟达打开了一个巨大的市场。事实上Amd 的显卡计算能力一直都比英伟达强一个数量级。好比rx580完虐1060 这两张卡在发行时 1060凭借dx11A黑游戏遥遥领先。到了现在随着dx12 Vulkan的来临1060已经到了尾声。此时580还是当红炸子鸡，当前最高级的大镖客2 580是完美适配。苏妈因为没钱所以ROCM投的钱有限生态搞不过英伟达。不过这两年进步非常明显。vega7和2080ti 的tensorflow training 对比也就慢了10%。不信看看下面的数据。最可怕的是 rocm一直都在慢慢的优化每次比上一次都更快。显卡战争随着才刚刚开始。

TensorFlow 1.14.4

git clone 网页链接 --recursive

python lambda-tensorflow-benchmark/benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --optimizer=sgd --model=resnet50 --num_gpus=1 --batch_size=64 --variable_update=replicated --distortions=false --num_batches=10000 --data_name=imagenet

FP32

- NVIDIA GTX 1080 Ti: ~215 images/sec

- NVIDIA RTX 2080 Ti: ~300 images/sec

- NVIDIA TITAN RTX: ~320 images/sec

- NVIDIA Tesla V100: ~383 images/sec

- AMD Radeon VII: ~275 images/sec

FP16

- NVIDIA GTX 1080 Ti: ~277 images/sec

- NVIDIA RTX 2080 Ti: ~495 images/sec

- NVIDIA TITAN RTX: ~518 images/sec

- NVIDIA Tesla V100: ~725 images/sec

- AMD Radeon VII: ~373 images/sec

So in FP32 for this ResNet50 benchmark the Radeon VII is about 9-10% slower than the 2080 Ti and about 25-30% faster than the 1080 Ti.

In FP16 it is 25% slower than the 2080 Ti and 35% faster than the 1080 Ti.

AIWorldLabs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自学C语言能去英伟达吗,$AMD(AMD)$ 坛子里有人对英伟达的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器... - 雪球...

来源：雪球App，作者：胡歌胡歌，(https://xueqiu.com/4961234302/140181275)$AMD(AMD)$ 坛子里有人对英伟达的cuda盲目吹捧。事实上cuda仅仅是C语言从底层对英伟达GPU的流处理器科学计算进行了长期的优化。老黄在十五六年前就开始在这方面努力结果AI的到来帮助英伟达打开了一个巨大的市场。事实上Amd 的显卡计算能力一直都比英伟达强一个数量级。好...
复制链接

扫一扫