一、背景
最近负责做一个平台的poc测试,性能测试要求测试1000并发下平台的表现,web服务器采用的是weblogic,版本是11g,10.3.6,所有操作都是基于这个版本(因为以前修改线程数的操作有些基于这个版本不能生效)。在LoadRunner压1000并发下,发现应用表现并不好,响应时间明显增加。
二、分析
监控服务器资源,发现集群平台服务器负载并不高,而web应用服务器负载同样也不高,服务器性能并没达到瓶颈。进入weblogic控制台,查看线程池,发现在压1000并发的时候,请求积压队列明显较多,而线程数只有50左右。说明一下,weblogic产品模式下,默认初始线程数为25,开发模式下好像是15,weblogic11g采用的是自调整线程池,看名字就可以猜出,他会根据应用情况自动增加减少线程数,而实际情况下,在压力增大的情况下,weblogic也确实增加了线程数,但是增加的线程数不足以应付该需求,于是自然而然地想到了增加线程数。
三、解决
weblogic11g已经不支持在控制台修改线程数,只能通过配置文件,网上有朋友说可以通过增加weblogic启动参数来配置线程数:
-Dweblogic.threadpool.MinPoolSize=100
-Dweblogic.threadpool.MaxPoolSize=500
该方法经试验,并不能生效,还好还一种方法,修改域下面conf里面的config.xml文件:
<server>
<name>AdminServer</name>
<self-tuning-thread-pool-size-min>400</self-tuning-thread-pool-size-min>
<self-tuning-thread-pool-size-max>400</self-tuning-thread-pool-size-max>
<listen-address/>
</server>
在这里把线程数最大值最小值都设成了400,400这个数值不是乱设的,WebLogic可以近乎线性地提高线程数。线程数越多,花费在线程切换的时间也就越多;线程数越小,CPU可能无法得到充分的利用。为获取一个理想的线程数,需要经过反复的测试。一般来说一个CPU最好小于50个线程数(注:笔者刚才发现之前我把CPU数当成了核心数,笔者用的服务器是24核,所以当时理所当然认为设置1000个线程数也是ok的)。最开始使用1000线程数做测试,因为最大并发数是1000,笔者想象来一个请求就给一个线程处理,没有请求排队,实际上确实如此,但是把线程数调低后,发现即使有排队情况出现,但响应时间却比之前1000线程要快,为什么会出现这种情况呢?原来还有一点我们忘记了,数据库连接池。数据库连接池也是影响性能的指标之一,想想应用1000个请求过来,但是数据库连接数不够,在数据库这边排队,还是会影响整体性能表现,所以如何配置weblogic线程数以及数据库连接线程数使整体性能达到最优,这需要再仔细测试,如果数据库连接数也能设置到1000,我想应该这是一个比较理想的设置,但很多情况下根据平台不同,不可能这么简单,过高的连接数总会占用过多系统资源,引发GC等一系列问题。笔者的应用根据多次测试,把数据库连接跟线程数设置成了一样的,都是400,这肯定不是最优的,但应该算是性能表现比较满意的一组值。
四、总结
1、出现性能瓶颈时,先找出现瓶颈的地方,是应用服务器还是数据库服务器
2、判断是否需要修改weblogic线程数以及数据库连接池的值
3、多次测试,得出一组合适的weblogic线程数的值以及数据库连接数的值