滴滴云RTX2080ti尝鲜,云端游戏卡搞起!

游戏显卡中RTX2080Ti可以说是业界翘楚了,虽然不是专门为深度学习而设计,但是在深度学习上的性能表现也是不错滴。而云端深度学习卡一般都是以Tesla系列为主,虽然号称专业的深度学习卡,但是某些型号也是很渣。

不知道有没有人想过把2080ti也扔到云端,然后可以按需付费,或者进行月租。肯定有吧,而且现在也有人做了。

滴滴云正在公测G4云服务(就是2080ti)。之前我做过GPU服务器的比较,滴滴云的性价比是非常高,质量基本也是有保障。很幸运我也拿到了免费测试的机会(真香)。

下面就分享下在滴滴云的2080ti 跑DeepFaceLab的体验。同时也可以回答下部分群友的问题。具体而完整的安装过程我会在另一篇文章中说明,本文主要就是看看跑DFL性能如何。

测试系统为: Windows Server 2019

测试的DFL版本为:20200315

测试素材:软件自带

 

登陆系统,安装完驱动后可以通过设备管理器或者GPU-Z或者任务管理器看到看到显卡型号为NVIDIA Ge Force RTX2080Ti,显存11GB

通过娱乐大师可以看到这台云端电脑的基本配置。其他配置我不关心,我就抓两个核心,显存11G,内存16G。下面就直接跑软件了,分别测试了,提取,模型,合成这几个环节的速度,大家可以对比一下自己的显卡,有2080ti的也可以看看有啥差别。

提取环节:

 

提取dst 头像的时候花了25分钟,每秒钟只处理了1张图片,这个性能让我陷入深深的怀疑,我怀疑这个阶段主要用的不是GPU而是CPU,否则没有理由2080ti不如我的1070吧?

训练环节。

这个环节没其他的,就是看单次迭代速度。

训练Quick96模型, 单次迭代时间为94ms

训练SAEHD模型,默认参数,单次迭代时间为249ms左右

训练SAEHD模型,结构archi为dfhd,其他默认,单次迭代时间为650ms左右。

训练SAEHD模型,像素Resolution 为192,其他默认,单次迭代时间为500ms左右。

 

训练SAEHD模型,像素Resolution 为256 ,bs=4,其他默认,单次迭代时间为600ms左右。

合成环节:

使用时间5分16秒,每秒处理4.85张图片。

下面以训练环节,做一个简单的横向对比。

Colab上P100默认参数时的数据,单次迭代299ms。

1070默认参数下的数据,单次迭代时间449ms。

2080ti 上面已经给出了,单次迭代时间为249ms的样子。

2080ti吊打1070这是必然,快得不是一丁半点。同时2080ti 还略强于P100。K80,P4,P40,T4这些也只能是弟弟了。虽然是游戏卡,但是干起来还是挺猛。

所以不管是云端还是本地,只要钱管够,买2080ti跑换脸还是非常不错的选择。做其他深度学习的研究也不错。如果不想本地烧显卡,占用游戏时间,或者想做一些云端服务搞APP之类,那么搞个云端的最爽了。只需要通过远程桌面连接,操作和本地没啥差别,无论何时何都可以轻松接入。

 

===============

滴滴云:https://i.didiyun.com/2dhaIAWXPkI

Deepfake中文网 : deepfaker.xyz

个人公众号:托尼是塔克

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
RTX 2080 Ti NVLink是指使用NVIDIA的NVLink技术将两张RTX 2080 Ti显卡连接在一起以实现多GPU并行计算和通信。NVLink是一种高速、低延迟的互联技术,它可以提供比传统PCIe接口更高的带宽和更低的延迟,从而实现更好的多GPU性能。RTX 2080 Ti NVLink可以通过NVLink连接板将两张显卡物理上连接在一起,以实现高效的数据传输和协同计算。这使得在支持多GPU加速的应用程序中,可以将计算负载分摊到多个GPU上并提高整体性能。 NCCL是Nvidia Collective multi-GPU Communication Library的简称,它是一个实现多GPU的collective communication通信库,可以提供高效的数据传输和通信功能。NCCL通过优化在PCIe、NVLink和InfiniBand等互联技术上的通信速度,将多个GPU之间的数据传输和通信效率最大化。 在进行RTX 2080 Ti NVLink配置时,可以使用nvidia-smi命令来测试GPU的连接拓扑。该命令可以显示GPU之间的连接方式,例如通过PCIe或NVLink等。通过查看连接拓扑,可以确认RTX 2080 Ti是否成功使用NVLink进行连接。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [NVIDIA-Turing-Architecture-WhitepaperNVIDIA-图灵架构的白皮书](https://download.csdn.net/download/weixin_40878684/10682852)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [4卡RTX2080Ti深度学习工作站是可行的 - NCCL](https://blog.csdn.net/danteLiujie/article/details/102901154)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值