系列文章目录
本文翻译自官网
前言
对于工程师来说,拿到一个新硬件后,最重要的事情莫过于立即尝试计算它的运行速度。另一方面,工程师之间对如何测量速度也争论不休。但就像很多事情一样,你应该测量什么实际上取决于你如何以及为什么要首先使用硬件。
一、使用 Geekbench 进行基准测试
基准测试框架有很多,但这是我的基准测试框架,而为什么是我的基准测试框架,这又回到了 "如何测试 "和 "为什么测试 "的问题上。Geekbench 并不只是直接计算一些毫无意义的数字,而是尝试进行一些测试,试图反映人们通常是如何使用电脑的:加载网站、渲染 PDF 和为图片添加滤镜。
与许多其他基准测试一样,Geekbench 的标题分数分为单核分数和多核分数。不过,由于基准测试的性质,Geekbench 分数在每次运行时会有很大差异。在 config.txt 中设置 force_turbo=1,并避免软件更新等操作,可以在一定程度上减少运行之间的噪音,但最佳策略还是取多次运行的平均值。我们就是这么做的。
如果运行的是 Raspberry Pi OS 的 64 位发行版,则会启用 16KB 页面大小,这样可以略微提高性能,但却牺牲了与旧版 ARMv7 32 位二进制文件的兼容性。
因此,我们也使用 16KB 和 4KB 页面大小对 Raspberry Pi 5 进行了测试。为此,我们使用了内部构建的 Geekbench 6.2,该版本已打补丁以支持 16KB 页面大小(现成的版本无法使用 16KB 页面大小,需要重新启动并使用 4KB 页面大小)。
对于 Geekbench 基准测试,数字越大越好!
1.1 单核
单核分数衡量的是一个 CPU 内核的处理能力,对于轻线程应用(即主要依靠单核处理指令)而言,单核分数更为重要。
Single Core | Score |
---|---|
Raspberry Pi 5 (16KB page size) | 774 |
Raspberry Pi 5 (4KB page size) | 764 |
Raspberry Pi 4 | 340 |
Geekbench 6.2 的单核分数:
在 Geekbench 6 的 100 次运行中,我们看到 Raspberry Pi 5 在页面大小为 4KB 的情况下平均得分为 764±6,而在页面大小为 16KB 的情况下平均得分为 774±6。与 Raspberry Pi 4 相比,速度提高了 2.4 倍。
1.2 多核
另外,多核跑分则试图衡量更实际的情况,即工作分布在主板 CPU 的所有内核上。这类分数更适用于重线程应用,如网络浏览器,它通常会将单个标签卸载到独立的进程线程中。
Multi Core | Score |
---|---|
Raspberry Pi 5 (16KB page size) | 1588 |
Raspberry Pi 5 (4KB page size) | 1604 |
Raspberry Pi 4 | 723 |
Geekbench 6.2 的多核分数:
在 Geekbench 6 的 100 次运行中,我们看到 Raspberry Pi 5 在页面大小为 4KB 的情况下平均得分为 1,604±22,而在页面大小为 16KB 的情况下平均得分为 1588±63。与 Raspberry Pi 4 相比,速度提高了 2.2 倍。
1.3 超频
因此:我们不建议人们对 Raspberry Pi 进行超频,我们也不一定会告诉你如何超频,或者在你超频时给你任何保证。另一方面,也许有人已经写了一篇关于超频的博文。谢谢 Jeff。
Core | 2.4GHz | 3.0GHz |
---|---|---|
Single-core score | 774 | 906 |
Multi-core score | 1604 | 1634 |
将 CPU 超频至 3.0GHz :
将 CPU 的频率从 2.4GHz 超频至 3.0GHz,将 GPU 的频率从 800MGHz 超频至 1GHz,我们可以看到性能有了相应的提升,单核测试得分提高了 1.2 倍。有趣的是,在多核测试中我们并没有看到类似的性能提升。这种差异可能是由于内存带宽的限制造成的,但很难确定。
二、其他人,其他基准
这就是我的基准测试结果,但你不应该只听我的一面之词。你绝对应该去看看其他人是如何在我们的新硬件上进行基准测试和性能测试的。
因为正如你所期望的那样,大多数人在拿到 Raspberry Pi 5 预览版后做的第一件事就是运行一些基准测试,这将为我们提供大量的数字和图表。
和往常一样,Jeff Geerling 提供了从以太网和无线吞吐量、内存吞吐量到密码性能的各种性能数据,其中 Raspberry Pi 5 的速度是 Raspberry Pi 4 的 45 倍,这要归功于 BCM2712 处理器为 Raspberry Pi 带来的 Arm 密码扩展。
随后,Core Electronics 公司的工作人员对这款硬件进行了一系列基准测试。
基准测试结果显示了酷睿电子的性能改进。
但我认为最有趣的基准测试来自 Seeed Studio,他们使用 ncnn 框架对 Raspberry Pi 5 进行了基准测试。
ncnn 框架是一个深度学习推理框架,支持各种神经网络模型(如 PyTorch 和 TensorFlow)和一系列硬件。该框架专为移动部署而设计,通过 Vulkan API 提供 GPU 加速,我们看到 Raspberry Pi 4 和 5 之间的性能提升非常有趣。
不过请记住,与我自己的 Geekbench 基准测试不同,这里的数据越小越好,而他们从 Raspberry Pi 5 上获得了一些非常不错的数据。在 Raspberry Pi 5 上使用 640×640 像素视频流测试 YOLOv8n 模型,推理速度约为 12fps。
总结
当我们在 2019 年推出 Raspberry Pi 4 时,其四核 Arm Cortex-A72 处理器的主频为 1.5GHz,比 2012 年的原始 Raspberry Pi 型号快了约 40 倍。但随着 Raspberry Pi 5 四核 Arm Cortex-A76 处理器主频达到 2.4GHz,我们现在的 CPU 和 GPU 性能再次提高了两到三倍,内存和 I/O 带宽大约提高了两倍,而且我们首次在旗舰 Raspberry Pi 设备上采用了 Raspberry Pi 芯片。
我们对性能的提升感到非常自豪。但最重要的是,我们看到人们在野外发现了我们在过去几年中取得的巨大进步。如果你想自己进行任何基准测试,请在下面的评论中提供链接:我们喜欢看你在做什么!