性能第二讲：性能优化-每个程序员都应该知道的数字-CSDN博客

本文链接：https://blog.csdn.net/qq_28959087/article/details/127471432

本文探讨了性能优化的重要性和常用指标，如CPU、内存、磁盘和网络的速度对比，以及商品中心核心接口QPS数据。通过理解这些数字，开发者能快速定位性能瓶颈并提升效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

性能第二讲：性能优化-每个程序员都应该知道的数字

文章目录

性能第二讲：性能优化-每个程序员都应该知道的数字

1、性能优化的重要性

1）性能优化非常通用，几乎对于所有线上项目都可以适用，大家掌握了之后，立马可以到项目中实践起来。，应该不存在不需要性能优化的项目。
2）性能优化大部分内容非常简单，几乎没有门槛，经验较浅的同学也很容易上手，同时性能优化也适用二八原则：掌握20%的内容，足以解决80%的问题。
3）性能优化很容易拿到结果，稍微有经验点的同学应该知道，做需求最怕拿不到结果，性能优化就不一样了，都是很直白的数字。1小时的任务，优化成5分钟，性能提升就是十来倍，简单粗暴。

2、性能指标

来源于 Jeff Dean 在谷歌的内部一次分布式系统的演讲，英文标题为：Numbers Everyone Should Know。

这些数字与我们后续做性能优化息息相关，因此我将这部分内容放在第一篇，帮助大家建立基本的性能概念。

先来看 Jeff Dean 所说的数字是哪些：

注：1μs = 1000ns、1ms = 1000μs

操作	耗时/延迟	*耗时10亿**
一级缓存读取（L1）	0.5ns	0.5s
分支错误预测	5ns	5s
二级缓存读取（L2）	7ns	7s
互斥锁的加锁解锁	25ns	25s
内存寻址	100ns	100s
Zippy压缩1KB数据	3000ns（3μs）	50min

在1Gbps网络上发送1KB数据	10,000ns（10μs）	2.8h
从SSD（1GB/s）随机读取4KB数据	150,000ns（150μs）	1.7days
从内存顺序读取1MB数据	250,000ns（250μs）	2.9days

数据包在同数据中心一个往返	500,000ns（500μs）	5.8days
从SSD（1GB/s）顺序读取1MB数据	1,000,000ns（1ms）	11.6days
磁盘寻道	10,000,000ns（10ms）	3.8months

从磁盘顺序读取1MB数据	20,000,000ns（20ms）	7.9months
数据包从美国到荷兰一个往返	150,000,000ns（150ms）	4.75years

这份数据的最初来源为 Peter Norvig 的文章：Teach Yourself Programming in Ten Years，地址：http://norvig.com/21-days.html。

伯克利的 Colin Scott 根据这份数据，通过一定的算法，制作了一个可以根据时间的推移而变化的网站，地址为：https://colin-scott.github.io/personal_website/research/interactive_latency.html，源码中注释有详细解释计算逻辑，例如网络带宽是按每2年增加1倍，DRAM带宽按每3年增加一倍。

根据 Colin Scott 的图表来看，到2021年，网络带宽、内存、SSD、磁盘，都有数量级的提升，而 CPU 相关的一二级缓存变化不大，有兴趣的可以自己点进去看一看。

3、看这些数据的目的

首先，这些数据肯定不是完全准确的，受限于众多环境因素的影响，其实很难有所谓的准确数字。

我们看这些数据更多是了解每个操作的耗时量级，各个操作之间的数量级比率，从而对于我们工作中接触到的一些相关知识有初步的概念。

而我将这个数据放在性能优化系列文章的开篇，主要想先传达几个概念：

1）CPU非常非常快

CPU执行大部分简单指令只需要1个时钟周期，我用个人电脑测试时，CPU可以睿频到4.40GHz（见第2点的测试图），也就是说此时执行一个简单指令需要的时间大约是1/4.4ns，也就是0.23ns（纳秒）。
这是什么概念了，举个简单的例子，即使是真空中传播的光，在0.23ns内也只能走不到7厘米。

2）内存很快了，但是相比CPU来说还是太慢了

CPU和内存之间的瓶颈通常称为冯·诺伊曼瓶颈。具体差别有多大了，我用自己的电脑做了个简单的测试。
CPU配置是 11th Gen Intel Core i5-11400F@2.60GHz，睿频4.40GHz，测试结果看也确实跑到了4.40GHz了，内存配置是 DDR4 3200MHz。
测试结果如下图所示：