性能基础之速读【性能之巅：洞悉系统、企业与云计算】

最新推荐文章于 2024-10-25 23:51:23 发布

7DGroup

最新推荐文章于 2024-10-25 23:51:23 发布

阅读量241

点赞数

分类专栏：性能测试

本文链接：https://blog.csdn.net/zeeslo/article/details/118255029

版权

性能测试专栏收录该内容

63 篇文章 14 订阅

订阅专栏

引言

综合来讲，这是一本介绍方法论的书，作者通过概念、模型、观测、实验手段来进行问题的剖析。另外本书的涉及范围之广，从内存、CPU、文件系统、存储硬件、网络等各个方面。并且本书通常以一个实例入手，深入的介绍系统原理，特别是在一些重点细节上，往往有超出一般的认识和方法。
本书函盖范围太广，更适合作为工具书时常翻阅，所以在阅读过程中也关注自己当前需要的方面。

第一章绪论

系统性能是对整个系统的研究，包括了所有的硬件组件和整个软件栈。所有数据路径上和软硬件上所发生的事情都包括在内，因为这些都有可能影响性能。

通用系统软件栈

性能的事情列表

性能领域包括了以下的事情：

设置性能目标和建立性能模型
基于软件或硬件原型进行性能特征归纳
对开发代码进行性能分析（软件整合之前）
执行软件非回归性测试（软件发布前或发布后）
针对软件发布版本的基准测试
目标环境中的概念验证测试
生产环境部署的配置优化
监控生产环境中运行的软件
特定问题的性能分析

两种性能分析视觉：资源分析和负载分析

术语容量规划 ( capacity planning) 指的是一系列事前行动。在设计阶段，包括通过研究开发软件的资源占用情况，来得知原有设计在多大程度上能满足目标需求。在部署后，包括监控资源的使用情况，这样问题在出现之前就能被预测。 !

资源分析指标：IOPS，吞吐量，使用率，饱和度
工作负载指标：吞吐量和延时。

性能分析必须量化问题的重要程度，有一个指标非常合适，就是延时(latency)。

动态跟踪技术把所有的软件变得可以监控，而且能用在真实的生产环境中。这项技术利用内存中的 CPU 指令并在这些指令之上动态构建检测数据。这样能从任何运行的软件中都可以获得定制话的性能统计数据，从而提供了远超系统的自带统计所能给予的观测性。

DTrace 对用户态和内核态的软件都提供了静态跟踪和动态跟踪，并且数据是实时产生的

受测系统

扰动(perturbation)是会影响结果的，扰动包括定时执行的系统活动、系统的其他用户以及其他的工作负载。现代环境的另一个困难是系统很可能由若干个网络化的组件组成，都用于处理输入工作负载，包括负载平衡、Web 服务器、数据库服务器、应用程序服务器，以及存储系统。

排队系统

排队理论以及使用率响应时间关系

方法

在取得数据之前就把事情理论化是一个严重的错误。不理智的人扭曲事实来适应理论，而不是改变理论来适应事实。

面对一个性能不佳且复杂的系统环境时，首先需要知道的挑战就是从什么地方开始分析、收集什么样的数据，以及如何分析这些数据。

通用的性能分析方法

第四章观测工具

性能观测工具可以按照系统级别和进程级别来分类，多数的工具要么基于计数器要么基于跟踪：

进程级别：

一般来说，上述这些工具是从 /proc 文件系统里读取统计信息的

跟踪

跟踪收集每一个事件的数据以供分析。跟踪框架一般默认是不启用的，因为跟踪捕获数据会有 CPU 开销，另外还需要不小的存储空间来存放数据。

系统级别：

进程级别：

第五章应用程序

性能调整离工作所执行的地方越近越好：最好在应用程序里，包括 Web 服务器、应用服务器、负载均衡器、文件服务器，等等。

设立性能目标能为你的性能分析工作指明方向，并帮助你选择要做的事情。没有清晰的目标，性能分析容易沦为随机的『钓鱼探险』。常见目标：

应用程序性能技术：选择 I/O 尺寸、缓存、缓冲区、轮训(epoll)、并发和并行、非阻塞 I/O、处理器绑定

编程语言相关：编译语言使用编译器优化、解释语言一般不是首选、虚拟机、垃圾回收

第六章 CPU - 第九章磁盘

CPU分析工具

街灯讹方法（奇葩的命名）
- 在熟悉的工具或流程中试错，比较盲目
Ad Hoc核对清单法
- 保证所有人知道如何检查最糟糕的问题，覆盖全面，但必须保持清单及时更新
诊断循环
- 假设--仪器检验--数据--假设
USE方法

本书重点方法，对于所有资源，查看它的使用率、饱和度、错误
第三章操作系统

了解操作系统和它的内核对于系统性能分析是至关重要的。你会经常需要进行针对系统行为的开发和测试，如系统调用是如何执行的、CPU 是如何调度线程的、有限大小的内存是如何影响性能的，或者是文件系统是如何处理 I/O 的。

这部分的内容本书主要介绍了基本的概念，最好还是结合《深入理解计算机系统》来弄懂，不然真的很容易一知半解，列举如下：
内核：内核执行、时钟、内核态
栈：用户栈和内核栈
中断和中断线程
中断优先级
进程：进程创建、进程生命周期、进程环境
系统调用
虚拟内存
内存管理
调度器
文件系统：VFS、I/O 栈
缓存（括号内为例子）：应用程序缓存、服务器缓存(Apache 缓存)、缓存服务器(Redis)、数据库缓存(MySQL 缓冲区高速缓存)、目录缓存(DNLC)、文件元数据缓存(inode 缓存)、操作系统缓冲区高速缓存(segvn)、文件系统主缓存(ZFS ARC)、文件系统次缓存(ZFS L2ARC)、设备缓存(ZFS vdev)、块缓存(缓冲区高速缓存)、磁盘控制器缓存(RAID 卡缓存)、存储阵列缓存、磁盘内置缓存
网络
设备驱动
多处理器：CPU 交叉调用
抢占
资源管理
观测性
计数器

内核维护了各种统计数据，称为计数器，用于对事件计数。通常计数器实现为无符号的整型数，发生事件时递增。

系统级别的计数器有：
vmstat: 虚拟内存和物理内存的统计，系统级别
mpstat: 每个 CPU 的使用情况
iostat: 每个磁盘 I/O 的使用情况，由块设备接口报告
netstat: 网络接口的统计，TCP/IP 栈的统计，以及每个连接的一些统计信息
sar: 各种各样的统计，能归档历史数据
ps: 进程状态，显示进程的各种统计信息，包括内存和 CPU 的使用
top: 按一个统计数据排序，显示排名高的进程
pmap: 将进程的内存段和使用统计一起列出
tcpdump: 网络包跟踪(libpcap lib)
blktrace: 块 I/O 跟踪
DTrace: 跟踪内核的内部活动和所有资源的使用情况，支持静态和动态的跟踪
SystemTap: 同上
perf: Linux 性能事件，跟踪静态和动态的指针
strace: 系统调用跟踪
gbd: 源码级别的调试器
延时
吞吐量
资源使用率