系统稳定性

1. 在线日志分析

    1.1 日志分析常用命令

    1.2 日志分析脚本

2.集群监控

    1.1 监控指标

        1.1.1 Load
        1.1.2 CPU利用率

            在Linux操作系统中,CPU的时间消耗主要在以下几个方面:用户进程、内核进程、中断处理、I/O等待、Nice时间、丢失时间、空闲等。而CPU的利用率则为这些时间所占总的百分比。通过CPU的利用率,能够客观的反映出CPU的使用和消耗情况。

            可以通过top命令来查看Linux的CPU消耗情况:

            top | grep Cpu

            094440_IlYk_2858189.png

            其中,CPU后面的各个列便是各种状态下CPU所消耗的时间占比

  • 用户时间(us): 表示CPU执行用户进程所占用的时间,通常情况下希望us的占比越高越好。
  • 系统时间(sy): 表示CPU内核所花费的时间,sy的占比较高,通常意味着系统在某些方面设计不合理,比如果频繁的系统调用导致用户态与内核态的频繁切换。
  • 调整时间(ni): 表示系统在调整进程优先级的时候所花费的时间。
  • 空闲时间(id): 表示系统处于空闲期,等待进程运行这个过程所占用的时间,id占比越低越好。
  • 等待时间(wa): 表示CPU在等待I/O操作所花费的时间,系统不应花费大量的时间来进行等待,否则便表示可能某些地方设计不合理。
  • 硬件中断处理时间(hi): 表示系统处理硬件中断所占用的时间。
  • 软件中断处理时间(si): 表示系统处理硬件中断所占用的时间。         
  • 丢失时间(st): 是在硬件虚拟化技术开始流行后操作系统新增的一列,表示强制等待虚拟CPU时间,此时正在为另一个虚拟处理器服务。如果st占比较高,则表示当前虚拟机与该宿主上的其它虚拟机间的CPU竞争较为频繁。
        1.1.3 磁盘剩余空间
        1.1.4 网络traffic(流量)
        1.1.5 磁盘I/O
        1.1.6 内存使用
        1.1.7 QPS
        1.1.8 RT
        1.1.9 Slect/PS
        1.1.10 Update/ps,Delete/ps
        1.1.11 GC

    1.2 心跳检测

    1.3 容量评估及应用

3.流程控制

    1.1 流量控制实施

    1.2 服务稳定性    

    1.3 高并发系统设计

4.性能优化

    1.1 如何寻找性能瓶颈

    1.2 性能测试工具

    1.3 性能优化措施    

5.Java应用故障排查

    1.1 常用的工具

    1.2 典型案例分析

转载于:https://my.oschina.net/jimilee/blog/810043

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值