一、性能参考指标
QPS:每秒钟请求量
平均RT(平均响应时间/平均延迟):指的是时间窗口内请求平均花费的时间
TP:top percentile
TP90=top percentile90(从小到大排序第90百分位)
TP90=30ms 表示90%的请求响应时间<=30ms
CPU资源至关重要,,因为它可以帮助我们评估计算机的性能和效率。通过监控CPU使用情况,可以识别CPU过载或利用率不足的情况,从而优化系统性能并确保有效利用系统资源。
二、三大性能理论
因为什么要性能优化?利特尔法则:QPS=系统水位/RT
怎么定位性能问题?木桶原理
怎么解决性能问题?阿姆达尔定律
三、生成火焰图
1、为什么需要火焰图?传统性能分析工具出书可能很冗长,通常给用户展示大量的细节信息和数据,而用户很难看到全貌,理解和定位到根本原因需要花费更多时间和精力。火焰图展示性能瓶颈的全景图,从而减少根本原因分析的时间。
2、火焰图如何帮助我们发现性能瓶颈?火焰图生成自堆栈跟踪信息,它们将多个堆栈跟踪记录整合在一起,形成一个表现程序运行时函数调用情况的图形。横轴格子的宽度代表其在采样中出现频率,所以一个格子的宽度越大,说明它是瓶颈原因的可能性就越大[CPU profile表示该方法小号的cpu越多;Lock profile表示该方法所阻塞越多]。
3、如何生成火焰图
yum install perf
采集堆栈:perf record -F 99 -p pid -g --sleep 60; perf script>out.perf
折叠堆栈:./stackcollapse perf.pl out.perf>out.folded
生成火焰图:./flamegraph.pl out.folded>test.svg
4、Java生成火焰图工具:asyns-profiler
cd asyns-profiler-3.0-macos
bin/asprof -h
常用用法:asport -d 时间 -e 火焰图类型 -f 文件名.html <pid>
Example:asprof -d 30 profile.html 3456
5、火焰图类型
5.1、On-CPU:线程在CPU上运行的时间
bin/asprof -d 20 -e cpu -f test01.html pid
5.2、Off-CPU:阻塞时间(CPU时间之外),在I/O、锁、计数器、换页等时间阻塞的时间
bin/asprof -d 20 -e lock -f test01.html pid
5.3、Hot/Cold:包含On-CPU和Off-CPU
bin/asprof -d 20 -e wall -f test01.html pid
5.4、Alloc:内存
bin/asprof -d 20 -e alloc-f test01.html pid
5.5、bin/asprof list jps:查看可执行时间
cpu,lock,alloc,wall,itimer
四、查看火焰图
每一列代表一个调用栈,每一个格子代表一个函数。
X轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。如果一个函数在X轴占据的宽度越宽,就表示它被抽到的次数越多,即执行的时间长。
Y轴表示调用栈,每一层是一个函数。调用栈越深,火焰图越高,顶部就是正在执行的函数,下面就是他的父函数。
X轴格子的宽度代表其在采样中出现的频率,所以一个格子的宽度越大,说明它是瓶颈原因的可能性就越大[CPU profile表示该方法小号的cpu越多;Lock profile表示该方法所阻塞越多]。