一次网站故障处理过程

一次网站故障处理过程 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

作者:田逸( [email]sery@163.com[/email] from [url]http://netsecurity.51cto.com/art/200802/65683.htm[/url]

 

春节还没过完就接到同事的电话,说论坛访问速度慢,遭致用户强烈的投诉,要求我马上处理。这个bbs是运行在Redhat AS 5上,由apachemysqlphpdiscuz组成,有129550位注册会员,同时在线的最高人数11128,按照当前的硬件条件,应该满足访问需求(新上线的HP服务器)。在浏览器输入论坛的url, 果然很慢,再联系朋友帮忙测试,打开网络还是很慢。

 

先不管这么多,登录到服务器上去看看再做下一步打算。还好,登录比较顺利。运行命令uptime看系统负载,很低呀,再运行命令top,uptime得出的结论基本吻合,于是得出结论:系统负载不大。

 

是否被恶意***呢?基于这个想法,察看系统帐号打开文件 /etc/passwd,没看见任何异常;运行命令 iptables –L –n 发现防火墙规则仍按我当初设定的策略执行,这些迹象表明,系统不存在安全问题。

 

那会不会是mysql的性能问题呢?用mysql客户端连接数据库,察看负载,其情况如下:

mysql> show processlist;

+---------+-----------+-----------+--------+---------+------+-------+------------------+

| Id      | User     | Host   | db    | Command | Time | State | Info           |

+---------+-----------+-----------+--------+---------+------+-------+------------------+

| 1917230 | bbsdiscuz | localhost | discuz | Sleep   |  284 |       | NULL             |

| 1917412 | bbsdiscuz | localhost | discuz | Sleep   |  223 |       | NULL             |

| 1917442 | bbsdiscuz | localhost | discuz | Sleep   |  222 |       | NULL             |

| 1917554 | bbsdiscuz | localhost | discuz | Sleep   |  205 |       | NULL             |

| ………………….. 省略若干 ………………………..

| 1918404 | bbsdiscuz | localhost | discuz | Sleep   |    0 |       | NULL             |

+---------+-----------+-----------+--------+---------+------+-------+------------------+

19 rows in set (0.00 sec)

从输出结果看,连接数和保持时间也在正常范围内。以前曾经有过mysql数据库连接数过多(达到设定的最大连接数)及会话保持时间(Time)过长的事故,从而导致网站访问速度变慢,以至于无法忍受。由此分析,这个故障不是由mysql数据库所引起的。

 

现在还剩下apache了,看来该怀疑一下它了。我们先看看有多少个httpd进程,其过程如下:

[root@web1 ~]# ps aux | grep httpd | grep -v grep | wc -l

256

结果刚好是apache默认设置的最大连接数,再执行 [root@web1 ~]# netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'  其运行结果如下所示:

LAST_ACK 3

SYN_RECV 628

………… 省略若干 …………

TIME_WAIT 524

这个结果表明请求数比较大但却没有得到适时的响应,再看一下这些请求都是发往那些服务端口,只需运行netstat –anp | grep –v unix ,发现绝大部分请求是针对80端口的。由这个现象基本可以断定是apache引起的麻烦。那好,我就从这里着手。关apache服务再启用,这时察看httpd进程,马上就是256.既然这样,我就在配置文件httpd.conf加入下面的代码块:

<IfModule prefork.c> 

StartServers 10

MinSpareServers 10

MaxSpareServers 15 

MaxClients 1500

ServerLimit 2000

MaxRequestsPerChild 10000 

</IfModule> 

执行apachectl –t ,报错,警告说MaxClients超过256,以至于apache服务不能正常运行,该小一点呢?好,改成150,运行后,查httpd进程数,刚好150。用浏览器访问论坛,还是十分的缓慢。看来得朝大的方向改,否则瞬间apache达到最大连接数,就不再响应新的请求。从前面的操作(把MaxClients的值改大超过256)可以知道,必须重新编译和安装apache才可以达到目的。当时曾经尝试把apache置于worker模式,但在编译时涉及到php,不想再节外生枝,就不再继续。我用的apache版本是httpd-<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />2.2.6,进安装包所在的目录(如我的目录是/root/httpd-2.2.6,即解压httpd-2.2.6.tgz后生成的目录),修改文件 server/mpm/prefork/prefork.c,把第77行的值改成1500,如下图所示:

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />

然后再编译,运行和安装。再使配置文件 httpd.conf MaxClients的值为1500,运行apachectl –t检查语法是否正确,无误后启用apache服务 apachectl start .现在,我们再回过头来察看apache的进程数,基本上在170-400这个范围,并且在不停的变化,隔设定的1500这个值还差得远;另外那些等待的请求值也降低了,这意味apache能正常响应用户的请求。在浏览器输入论坛的url,速度正常,再请其他朋友帮着测试,一切正常。

 

 

                                                2008-2-18

 

                                                海淀福缘门悟真阁

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值