系统性能指标与调优思路(一)

参考文档:性能优化指南:性能优化的一般性原则与方法http://www.cnblogs.com/xybaby/p/9055734.htmllazy ideas in programming(编程中的惰性思想)http://www.cnblogs.com/xybaby/p/6425735.html...
摘要由CSDN通过智能技术生成

年初活动期间,负责的系统被活动的流量给冲垮了。尽管在后续的阶段中,对系统进行了优化,但是这种行为颇有点亡羊补牢的感觉。

是否能在事件发生之前,就提前根据各方面的指标进行事故的规避呢?如果可以,又应该由哪几个维度去衡量与评估系统?尽管系统崩溃的原因各式各样,但如果有一套基于指标建立合理完善的监控机制,则能最大程度地对可能发生的风险进行提前防范。

基于以上理由,我想尝试去汇总一些指标维度去分析一个系统的健壮性。

一、响应时间、并发数以及吞吐量

响应时间是我们经常关注的一个指标。它可以是发起请求到系统接收请求最终传输完成数据所用的时间。从这句话的描述我们可以知道,这里包括两部分耗时,一部分是网络传输耗时,另一部分则是程序本身自己处理请求的耗时。

吞吐量也是另一个十分重要的指标。它一般指在单位时间里系统所能完成的请求数。
跟吞吐量比较密切的几个量化指标:TPS(每秒事务数)、QPS(每秒查询数)、响应时间、并发数

他们的关系是:
QPS(TPS)=并发数/平均响应时间

二、资源利用率

资源利用率包括CPU利用率、CPU负载,内存使用率,磁盘IO,网卡负载(NetWork Load),网卡队列情况等。
由于这里每一个小点都足以用不同的文章来阐述,这里仅挑几个小点来进行扩展,其他见各自的文章。具体的文章目录见:【此处应有链接】。

2.1 CPU相关

CPU利用率和CPU负载,我们通常在linux采用top命令查看。
加粗样式

也可以考虑用vmstat来进行查看
在这里插入图片描述

0.2%us 用户空间占用CPU百分比
0.2%sy 内核空间占用CPU百分比
0.0%ni 用户进程空间内改变过优先级的进程占用CPU百分比
98.1%id 空闲cpu占比
1.4%wa 等待输入输出的CPU时间百分比
r 表示运行队列的大小

各指标合理范围
us+sy 合理范围在60%~85%。大于85%,进程需要在运行队列等待,响应时间和业务吞吐量会受损害;us过大,说明用户进程占用cpu,sy过大,说明系统管理方面占用了较多的资源。

wa 是等待输入输出的CPU时间百分比,一般小于25%,超过25%,说明磁盘密集工作负载的结果,系统的磁盘活其他I/O有可能有问题。可以通过iostat/SAR -c进一步分析。

Id(idle):大于40,如果r经常大于4,且id经常小于40,表示cpu负载很重。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值