常用技能(二)

题目2: 某linux服务器平时负载很轻,cpu在10%-20%之间,但是每周都会有几天在不定时间突然跃升到100%,然后导致该服务器拒绝一切响应(包括ssh链接在内),无奈之下只能电话通过机房重启。

现在,负载飙升时无法连接ssh,暂时无法确认负载飙升原因,请给出你想到的处理步骤和解决思路。

不要告诉我您会设置一个24小时短信提醒,那是最基本基本的了。

参考答案

简单说,关键是无人值守脚本,无人值守脚本要

1:记录负载提升时的系统状态和进程列表,进程资源占用数据。

2:自动对突然增加负载的用户或系统进程进行处理,

3:记录处理结果和处理后的状态。

无人值守记录是系统维护的关键点,有很多人用第三方工具,当然很好,但是必要的时候必须亲自做一些监控脚本,这东西用什么写都可以,php,perl,ruby都无所谓,能记录,能执行关闭进程和启动进程的操作就可以。

 

题目3:某linux 服务器一直负载很轻,但是会突然拒绝正常的服务,此时仍然可以登录,仍然看到在线很轻的负载,请告诉我你分析排查的思路。

参考答案

这种问题当然有很多种可能,分析日志也好,分析系统状态也好,不过根据caoz经验,出这种问题,80%以上是系统某参数越界,这种越界还蛮多的,比如最多文件打开数,系统最大连接数,syn_backlog,甚至最多文件节点数(看硬盘空间还有,其实inode没有了,大量琐碎小文件就会出这个问题!)还有,ip_contrack什么参数,可能导致网络丢包严重, 所以这个问题的关键是,对linux各项内核参数必须有深入了解,有时候你看服务器跑不动了,可能改一下参数马上就好了,但是改哪个参数,怎么改,这就只能是经验和搜索技巧了。

posted on 2016-11-23 14:13 Mr.毛小毛 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/maowenqiang/p/6093449.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值