“新的”旧设备历险记:Dell T5810+2680v4+RTX 2080Ti 22GB(划掉)3060 12GB注意事项

本文主要是我记录的笔记,防止未来遇到解决过的问题却要重新研究解决方案,不过由于这篇文章从开始写到今天差不多有 20 天了,很多细节一时记不起了,所以未来可能会进行一些更新。

手上的设备大多显卡不强,因为之前也没涉猎显卡编程或者深度学习,所以设备大多强 CPU,弱 GPU。不过现在打算好好学一下,所以需要一台新设备。不过预算不高,所以选择了如下配置(以下都是实际付款价):

由于我买的 2080ti 有风啸声,实在遭不住,所以我还是退了,换个性能一般但不吵的 3060 12GB,初学机器学习也够了。

请添加图片描述

需要注意:一定买你家附近的城市的,尤其是你比较想快一些进入学习的。一方面运费贵很多,而且有问题很快就能解决。我买的不在江浙沪,路上用了两三天。结果到了发现电源给发成 425w 的了,我原本买的 685w 的,后来发现有 825w 的(2080ti 店家推荐 750w+ 的),就让店家给我直接发的更高的,补了差价。

由于我有一堆硬盘,所以我没买新的硬盘。但是需要注意如果使用 m2 的硬盘记得买转接卡,T5810 没有相关接口。闲鱼上大概 10 元左右。
到手记得看一下 BIOS 中的设置,有时候开的是 RAID 模式,如果你需要就开着,不需要还是关掉好,不然硬盘后续可能不好处理,比如带电拔掉之后会直接不能用。

此外,T5810 没有无线网卡和蓝牙,我找了个 Win 和 Linux 都能用的,选了选 还是直接 AX210 比较稳,也贵不了太多。

如果你想打游戏,可以多掏 100 买 2667 v4 或者 2690 v4,主频稍微高一些,我是打算后续升级,因为最近这两款价格有点涨价。我买的 2680 v4 绝大部分时候实际最高频率只有 2.88GHz,很多时候并达不到参数表上 3.30GHz。这导致在很多游戏刚开始的时候,会掉帧卡顿(哪怕是 2080ti),某些游戏 3060 12G 上 4k 和 2k 帧数都可能差不多,比如最近新出的燕云十六声。

性能测试

首先测试了一下 CPU 的性能,毕竟新电源还没到,显卡不敢插。

CPU

CPU-Z 测试结果如下:
请添加图片描述
可以看到和 9900K 多核差不多,单核差不少。不过 50 块要什么自行车,除了显卡之外的价格如果买最近的设备,只能买 5600x 板U。而且 ECC 的内存也便宜一些。

初步使用下来和近期的 CPU 也确实没什么区别。只有刚开游戏或者切换大场景的时候会卡顿一下,加载之后没啥区别了,不过某些时候吃单核的游戏还是不行,就像我前面说的那样。

OBS 1080P 30帧 40Mbps 码率中等质量模式软编码的时候,CPU 使用率仅 5%~10%。

不过这个 CPU 有个好处就是它的浮点性能其实非常不错,而且非常便宜,因为浮点性能只和浮点指令集、频率、核心数量(不过某些代、型号给的并行通道数也不一样,这种比较少见,但确实有)有关系,和 IPC 什么关系不大。2680 v4 的理论基础频率的浮点性能是 537.6 GFLOPS,这相当于 13500 或者 12800H 的理论性能。我目前只用了双通道,因为当时不敢确定能不能用。如果使用四通道的话,和 DDR5 4800MHz 双通道的带宽差不多。为什么提这个呢,因为我一开始使用 Ollama 3B 的时候没发现是跑在 CPU 上的,后来才注意到的,不得不说这个速率并不是不能接受。如果你想更进一步的话,可以买 2698 v4(704 GFLOPS),大概 12700K 的浮点性能水平。

个人不推荐 2699 v4(774.4 GFLOPS)或者 2699A v4(844.8 GFLOPS),虽然这两个的浮点性能能到 13700K 或 14600K 的水平。但是价格要 920,这个性价比太差了(2698 v4 性价比其实也不高),虽然比 2680 v4 提升不少,但是初学来说不划算。

请添加图片描述
请添加图片描述

这个速度做一些简单的任务还是很不错的。

显卡

需要注意,Dell T5810 和 T5820 机箱里可以放下很长的显卡,但是放不下很高的,不然侧盖盖不上,比如我买的 3060 就比较高,导致我只能这样放着,不过这样散热不错,而且直接把前面的风扇拔了,满载情况下都非常非常安静:

请添加图片描述

2080TI 22GB

2080Ti 22GB 的话性能非常不错,由于配件非常坎坷,直到我退的那天我都没好好进行测试,只测了一些游戏。

请添加图片描述

请添加图片描述
请添加图片描述

绝大部分游戏都可以稳定 4k60 帧。而且拉过电压之后,可以做到满载 200w 不到。这样 CPU + GPU 满载可以做到 300W 左右。

古墓丽影 10 的 4k 全高的测试如下:
古墓丽影10在2080TI 22GB上的表现
原神的 4k 表现(米哈游的游戏都会用最高频率,所以功耗巨高):

请添加图片描述

同时开原神和崩坏星穹铁道(这里我降压超频了一下,所以不再是 200W 了):

请添加图片描述

大显存真的蛮爽的,生化危机 3 可以直接拉满材质(8 GB)。(这里没图)

3DMark 测试如下:
请添加图片描述

请添加图片描述

可惜这个涡轮扇有尖锐啸叫,折磨的我神经不舒服,缓了好几天才好。所以很烦,也不想多花钱多花精力了。2080TI 22GB 在机器学习方面仅次于 3090 和 4090(只看消费级显卡),性价比非常高,如果你要买的话,建议直接上三风扇的(要 2800)。

3060 12GB

退了 2080TI 22GB 之后,在闲鱼上找了个 3060 12GB 在保的,只用 1500,因为京东之类的全新要1900,还是很普通的那种。

请添加图片描述

如果你的目的是机器学习,并不涉及并行编程之类的学习,那么可以考虑一下 Intel A770 16GB 或者 B580 12GB,我还是想学一下 CUDA 编程的,所以还是选了 Nvidia 的卡。后者我看 Youtube 上有人训练 GPT2 的速度是 3090 的三分之二,性价比也非常不错。并且有谣言说还有 24g 版本的。如果真的有并且价格合适的话,那就可以完美替代 2080TI 22GB,毕竟有官方保修。后续学的不错,要更换设备的话,这个也算是一个选择,毕竟 Nvidia 的 50 系大显存也非常贵。
请添加图片描述

游戏

3060 12GB 的游戏性能不如 2080ti 是毋庸置疑的,再加上频率不高的 CPU,那么很多游戏玩起来其实不得劲,调低调高画质也没啥用,就是频率低的问题。

燕云十六声清河区域比较流畅,但是到开封就不行了。最搞笑的是 2k 和 4k 帧数一样(没错前面我说的例子就是燕云十六声)。可能是新游戏优化还不行,我记得一开始版本并没有这个问题,等后续更新了。

编码

关于编码这部分展开请见另一篇博客:《Ubuntu上,ffmpeg如何使用cuda硬件解码、编码、转码加速 - ZhongUncle’s CSDN》

FFMPEG 硬件加速转码,6000k码率,30帧,速度大概是 16 倍,真的挺快的。

在游玩燕云十六声的时候,使用 OBS 录屏(nvenc 编码)8000k码率的和软编码画质差不多。采用 40Mbps 编码的时候,要比软编码差一点,但差的不是很多。关于这部分我会单独开一篇博客,之前用的是 MX250 这种英伟达 GPU,编码速度和质量要比 QSV 差很多,所以之前并不熟悉,刚好熟悉熟悉。这里简单列一下截图:

硬件编码器是有个支持码率范围的,过高和过低都会有较大的画质损耗或者编码问题。我这里是按照个人习惯设置的,并没有按照 Nvidia 的建议设置。

麦田这种事物比较密集的场景很适合看码率损耗(你还可以用色彩多的画面检查,这个更明显),如下,可以看到麦穗虽然已经无法看清,但是远观并不糊(下面的图二次压缩过,但是也够看出来损耗可以接受了):

请添加图片描述

请添加图片描述

请添加图片描述

ML

机器学习方面,这卡很适合初学者。

半精度浮点性能实际测下来是 27.8 TFlops:
请添加图片描述

Ollama 的情况请看我的这篇博客《在Linux上如何让ollama在GPU上运行模型 - ZhongUncle’s CSDN》

Whisper 的话博客我还没写完,写完会贴在这。

关于微调模型,我微调 Llama3.2 1B 在 2 个 epoch 大概是 52 分钟:

请添加图片描述
请添加图片描述

没跑 3B 是因为我还不是很熟练,跑 3B 的时候 OOM (Out of Memory,超出显存)了,其实你看上面跑 1B 就 10GB 了。后续等我学会了再展开说说,这里的代码绝对是有问题的。

Dell T5810

我本来想买的是 Dell T5820,但是看了看发现 Dell T5810 更划算一些。不过由于 Dell T5810 是 2015 年初的设备,那时候 AMD 还是卖大楼救自己,Nvidia 刚刚发布了 980Ti,T5810 用 CPU 的是第一代 14nm,是5代酷睿同款(对,就是4代和6代中间特别短生命周期的 14nm 第一代)。,所以设备上有很多设计与现在的并不同,比如默认不装 Wi-Fi 和蓝牙,没有 M.2 接口。如果你对接口数量和种类有需要的话,那么可以看看 T5820,接口更加丰富一些。

CPU

CPU 这个你要看看 BIOS 支不支持 v4,因为 T5810 可以使用 v3 和 v4 两代处理器,但是最早的 BIOS 并不支持 v4。关于这点,其实你可以看店家卖的套装,如果是 v4,一般都支持。

内存

T5810 只支持 2400MHz 的内存,在今天虽然不高,但是有四通道,频率可以当作 4800MHz 的双通道了。

而且 DDR4 ECC 2400MHz 的内存比普通内存要便宜一些,但是要注意一点:买的是 2RX4 还是 4RX4 的,因为二者不能混用。比如我现在买了两条 16GB 的 2RX4,那么未来要再扩容,必须也是 2RX4 的。

2RX4 的大容量频率会高,但是 T5810 最高只支持 2400MHz ,如果上高频会浪费一部分钱,所以要买大容量内存的话还是 4RX4 的比较划算。

请添加图片描述
它有 8 个插槽,哪怕 16GB 单条,最高也能 128GB,哪怕双显卡也足够用了(因为支持的双显卡有限,这点你看下一节就明白我的意思了,最高也就 48GB 显存,一般内存是显存 2 倍比较好),当然,你要需要大容量内存的话,可以 64GB 单条,总计能有 512GB。

内存插槽如下,插法是先插白的,插满了再插黑的。这点文档没写,我去问的店家。
请添加图片描述

显卡供电线

T5810 的显卡供电线是 8Pin 转双 6Pin 的,不过现在显卡 6Pin 的太少了,需要你买一个单 8Pin 转单、双 8Pin 的。

为什么单的也要转接,因为供电板的显卡接口不是现在通用的那种,是显卡上的那种接口,也就是说,这玩意的供电线两头是一样的:
请添加图片描述

下图左侧是自带的,右侧是现在通用电源使用的接头:

请添加图片描述

接口

T5810 主板信息如下:
请添加图片描述
有两个插槽可以插显卡(就是两个有“蓝耳朵”卡扣的),我将显卡插到上图中“3”的插槽,因为供电线比较短。

虽然插槽上也写最高 225W,但是单卡 350W 是没问题的,双卡有点悬。因为以前是 6 Pin 的接头,算下来就是 225W。电源线一般是看接头部分能不能抗住,线一般都是单根导线能扛 1500W,8Pin你自己算算。这点是我跑到工厂买线的时候问老师傅的,这个老师傅之前在上海徐家汇做电脑线的,我特地问一转二能不能扛住,老师傅就和我说了上面的一大堆。

所以虽然有两个插槽,但是如果你要上两个 3090,总共 700W,最少是双 8 Pin,那么需要 1 转 4,抛开 PCIe 提供的 75W,也就是说一个 8 Pin 要扛 550W,这个就很悬了。尽管 T5810 最高有 1300W 的电源。
不过按照设计,上两个 225W 的应该是可以的,但是你要找到单 8 Pin 的显卡。性价比比较高的就是 Tesla P100,不过也有很多 Tesla 卡是单 8 Pin,但是价格就很高了。比较新的单 8 Pin 显卡是 4070 Super(也是得找有的厂商做的),而且这个卡刚好是 220W。不过这卡也不支持 NVLink。这里只是记录,方便日后查看。

我将 M.2 转 PCIe 放到了 6 号插槽,我买了单盘的转接卡,据文档说是支持拆分的,所以这个插槽最高可以买一分二的转接卡。不过我图便宜还是买的单转卡,闲鱼上就 10 块钱啊,还包邮。后续可能还是得上个硬盘散热,笔记本上只有 42 度的,在这挂着都有 50 度(双系统,我给他装的 Ubuntu,但是在 Windows 上看温度有 50,啥都没用呢)。

网卡放到了 4 号插槽,虽然只有一个 PCIe 2.0 通道,但这带宽也有 500 MB/s,换算过来是 4 千兆,上网够够的了。

Wi-Fi与蓝牙

我一开始想买 Realtek RTL8852BE,因为就 43,非常的的便宜,不过看了半天发现问题比较多,找了半天发现 AX210 的居然有 88 的,那就直接上就行了。而且是转接的这种,后续可以自己升级网卡:

请添加图片描述
如果你是 Linux,那么直接插上就能用,但如果你是 Windows,那么事先要在 Intel 官网下好驱动:Intel® Wi-Fi 6E AX210 Latest Drivers & Software,需要注意 Wi-Fi 和蓝牙是两个驱动,都要下好。

硬盘

硬盘我用了一块 M.2 转 PCIe,一块 SATA,都是固态。本来想装一块 10TB 的机械硬盘,但是装上之后,使用起来好奇怪,好多问题,而且经常卡掉,最后就放弃了,使用内置纯固态 + DAS了。

装系统

好久没装双系统了,让 Windows 给坑了一次:Windows 不会显示硬盘名称,只显示“磁盘 0”、“磁盘 1”,而我的硬盘都是 1TB 的,根本分不出来。所以建议先装 Windows,然后把硬盘拔了,然后再把另一个硬盘插上,再装 Ubuntu。

希望能帮到有需要的人~

### NVIDIA GeForce RTX 2080 Ti 双卡对比 RTX 3090 性能和特点 #### 显存容量 对于深度学习应用而言,显存是非常重要的资源。RTX 2080 Ti 单张拥有11GB GDDR6显存,在双卡配置下总共有22GB可用;而单张RTX 3090则配备了高达24GB的GDDR6X显存[^1]。 #### CUDA核心数量 RTX 2080 Ti基于Turing架构,每张卡具有4352个CUDA核心。相比之下,RTX 3090采用Ampere架构,具备更多达10496个CUDA核心,这使得其在处理大规模并行计算任务时更具优势。 #### Tensor Cores 和 FP32 吞吐量 Tensor Core的数量也有所不同:RTX 2080 Ti有544个Tensor Cores用于加速混合精度训练;而RTX 3090增加到了328个更强大的第三代Tensor Cores,并支持更高的FP32吞吐量,从而提高了AI模型训练效率。 #### NVLink互联技术 当考虑多GPU设置时,NVLink连接可以在两块RTX 2080 Ti之间提供高速互连带宽(最高可达100 GB/s),这对于某些特定应用场景下的数据交换非常有利。然而需要注意的是,不是所有的主板都支持此功能,而且并非所有软件都能充分利用这种链接带来的好处[^2]。 #### 功耗与散热设计 功耗方面,两张RTX 2080 Ti加起来可能会超过系统的供电能力,因此需要确保电源供应充足以及良好的通风条件来维持稳定运行。另一方面,尽管RTX 3090单独一张就有着较高的功率需求,但由于它集成了更多的硬件资源于单一PCB上,所以在相同工作负载条件下可能反而会表现出更好的能耗比。 ```python # Python代码示例展示如何查询当前使用的GPU型号及其基本信息 import GPUtil gpus = GPUtil.getGPUs() for gpu in gpus: print(f"ID {gpu.id}: {gpu.name}, Memory Total: {gpu.memoryTotal}MB, Load: {gpu.load*100}%") ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值