Transfomrer Benchmark3090对比3090Ti(跟李沐学AI作业简化版)

本文对RTX3090和3090Ti进行了性能对比测试,主要基于Ubuntu20.04系统,AMD5800处理器,16线程配置,使用Pytorch1.13和GPU环境。Micro_bench测试显示3090Ti在单精度上领先10-15%,而在半精度上两者表现接近。由于硬件限制,transformers的多GPU测试尚未进行。
摘要由CSDN通过智能技术生成

在看完李沐老师装机双卡3090Ti作为深度学习工作机的视频后,我决定装一台双卡3090的机器作为深度学习主机。本文主要进行3090和3090Ti性能的对比测试,对比一下看跟李沐老师的工作机差距有多大。
环境:
Ubuntu20.04
AMD5800 8core 16Thread
RTX3090
Pytorch1.13(gpu)
Python3.9

一. micro_bench性能展示

沐神源代码
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
请添加图片描述

二. transformers性能展示

沐神源代码
由于目前机器只有单卡3090,MultiGPU的测试随后进行补充。
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
总结:单精度跟3090TI有一些差距(10~15%),半精度几乎无差距。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值