在学校上课的时候一般习惯带着电脑去教室,选用轻薄的办公本或者 Mac整天带着到处跑。但从校园跨入社会后突然发现办公场景慢慢从移动办公转为固定场所的办公,公司因为保密等原因不能带私人电脑进公司,在家用办公本性能又不够用,甚至由于写代码的原因,电脑性能需要同时支持4K屏游戏+2K屏视频工作,直播,于是对于新机器性能的高要求促使我要在现存市场找到一款高性能的主机设备。
思考再三,顾及到办公桌被两个显示器占满的空间,开始寻找轻量级高性能的主机设备,最后将视线落到了英特尔NUC12蝰蛇峡谷(Serpent Canyon)上来。NUC全称为Next Unit of Computing,是英特尔2013年推出的迷你主机,寓意下一世代主机。特点是外形小巧,在超迷你电脑这一块,Intel NUC一直都是业界标杆。
机器的CPU选的是i7-12700H,采用了6大核8小核的设计,实现了14核20线程的超高规格。这是一款采用了intel 10nm工艺的最新处理器,采用 BGA1744的 Alder Lake-H 架构,基准频率为2.69GHz,最大睿频可达4.7GHz,而小核的最大睿频可达3.5GHz,TDP为45W,最大可配置为115W,三级缓存高达24MB。
显卡方面的Arc A770M采用的ACM-G10核心,基于台积电N6 6nm制程工艺,集成32个Xe核心,拥有4096个流处理器,256个纹理单元、128个ROP单元。
NUC12蝰蛇峡谷在极其有限的空间内,集成了i7-12000H处理器和Arc A770M 16GB独显这样的高性能硬件。此外,该 NUC 提供两个 DDR4-3200 SO-DIMM 内存插槽,最大容量 64GB,可选傲腾内存加速。两个 M.2 2280 PCIe 4.0 x4 SSD 插槽,一个 M.2 2280 PCIe 3.0 x4/SATA SSD 插槽,提供的这些扩展接口能够大大满足日常使用的办公与游戏需求。从外观上看,NUC12蝰蛇峡谷的宽度与茶杯一致,抛弃掉厚重的机箱,将整台主机浓缩到短小精悍的设备中。主机的侧面与顶部提供整片的散热孔,在运行过程中没有散热产生的噪声,而且设备温度也保持在比较稳定的水平。
此外,最让我看中的是英特尔 Arc A770M GPU 拥有 16 GB GDDR6 显存,通过针对游戏和最新视觉技术优化的新微架构提升游戏性能,包括 AI 增强升级、实时光线追踪和对 DirectX 12 Ultimate 的全面支持。
由于职业习惯,在了解到机器拥有的大显存后开始思考能不能在机器上部署跑深度学习相关的任务。事实上,目前A卡虽然不能使用cuda,但是也提供了一整套开源的ROCm(Radeon Open Compute)框架,相比于CUDA,ROCm拥有比更强的包容性和开放性。和CUDA只能在特定型号的NVIDIA GPU上运行不同,ROCm希望能在各种不同的硬件上运行。
首先安装好 Ubuntu的操作系统和 AMD ROCm 平台,配置好GPU访问权与PATH环境变量,再通过 Docker 部署好 ROCm 版的 PyTorch 后就可以运行 PyTorch 代码进行使用了,由于ROCm的PyTorch并没有完全在每种GPU上支持PyTorch的全部CUDA函数,小部分很有可能通过不了。
在部署完环境后就开始测试,我们选用 OpenVINO 用来部署训练模型做推理。OpenVINO是一个Pipeline工具集,同时可以兼容各种开源框架训练好的模型,拥有算法模型上线部署的各种能力,只要掌握了该工具,你可以轻松的将预训练模型在Intel上快速部署起来。
选择部署 YOLO v5来测试深度学习环境,把训练好的模型文件可视化看看,通过Netron,查看yolov5s.onnx模型的输入和输出。
通过 OpenVISO 加载 YOLO v5 的模型后进行性能测试:
Inference 的速度大概在8-10 ms 左右,证明在该设备上能稳定、高效的运行模型,等再体验一段时间后试试对最近大火的 stable diffusion 进行尝试。接下来还是先通过3DMark测试来确认其性能表现。测试模式为CPU Profile、Speed Way以及3DMark新增的Intel XeSS。CPU Profile 涉及的是一个名为“Boids”,也就是类鸟群体的计算框架,这个框架很容易被并行化计算,因此较为适合考察单线程到多线程的性能变化情况。Speed Way GPU 基准测试程序,使用光线追踪和实时全局照明来渲染逼真的照明和反射,支持 DirectX 12 Ultimate 功能来优化性能和视觉质量,而XeSS则是针对英特尔XeSS超采样技术的专项测试。
3DMark CPU Profile的最大线程成绩,代表了CPU在使用所有可用的线程时的全部性能潜能。对应的实际使用情况是在游戏之外的极其繁重的多线程工作负载中,例如电影质量的渲染、模拟和科学分析这些应用场景。而16线程成绩,代表了需要密集计算的任务下处理器的能力,例如数码内容创建和3D渲染都得益于多线程,可以看到该项得分也达到了相当优秀的得分。
Speed Way GPU 在带动4K主屏+2K副屏的前提下也能达到比较不错的得分水平。
3DMark XeSS测试两次生成基于3DMarkPortRoyal基准的场景,第一次运行通过使用时间抗锯齿(TAA)渲染场景以获得所需的输出分辨率来计算基线性能。第二遍以较低的分辨率渲染舞台,然后利用指定的XeSS模式放大帧。结果显示每次运行的平均每秒帧数以及定义为百分比的性能差异。在XeSS 打开后,画面表现效果在4K分辨率下直接提升了45%。
随后也对一些主流游戏进行了简单的体验,在原神的4K高配60帧的环境下测试发现跑图过程非常流畅,对于一些场景切换与密集建模的地方也有比较稳定的帧率。
总结:
作为一台兼顾办公工作与娱乐游戏的高性能的主机,英特尔NUC消费迷你主机在一本专业书的厚度下提供了如此强劲的性能体验,而且包括CPU的多线程性能以及显卡的16G显存,能同时支撑深度学习场景以及游戏场景的兼顾,而且主机酷炫的外表,性能强悍,扩展丰富等优点也扩展了应用场景和需求。总的看下来属于几乎没有短板、而且优势明显的迷你计算机,适合轻度和中度的办公人群日常使用。另外蝰蛇峡谷从开始发售9999元到现在已降至7000元左右,还在等待的朋友可以冲了。