一、内存调优
内存方式的设置是在 catalina.sh 中,调整一下 JAVA_OPTS 变量即可,因为后
面的启动参数会把 JAVA_OPTS 作为 JVM 的启动参数来处理。
具体设置如下:
JAVA_OPTS="$JAVA_OPTS -Xmx3550m -Xms3550m -Xss128k -
XX:NewRatio=4 -XX:SurvivorRatio=4"
其各项参数如下:
-Xmx3550m:设置 JVM 最大可用内存为 3550M。
-Xms3550m:设置 JVM 促使内存为 3550m。此值可以设置与-Xmx 相同,以
避免每次垃圾回收完成后 JVM 重新分配内存。
-Xmn2g:设置年轻代大小为 2G。整个堆大小=年轻代大小 + 年老代大小 +
持久代大小。持久代一般固定大小为 64m,所以增大年轻代后,将会减小年老
代大小。此值对系统性能影响较大,Sun 官方推荐配置为整个堆的 3/8。
-Xss128k:设置每个线程的堆栈大小。JDK5.0 以后每个线程堆栈大小为 1M,
以前每个线程堆栈大小为 256K。更具应用的线程所需内存大小进行调整。在相
同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的
线程数还是有限制的,不能无限生成,经验值在 3000~5000 左右。
-XX:NewRatio=4:设置年轻代(包括 Eden 和两个 Survivor 区)与年老代的比
值(除去持久代)。设置为 4,则年轻代与年老代所占比值为 1:4,年轻代占
整个堆栈的 1/5
-XX:SurvivorRatio=4:设置年轻代中 Eden 区与 Survivor 区的大小比值。设置
为 4,则两个 Survivor 区与一个 Eden 区的比值为 2:4,一个 Survivor 区占整
个年轻代的 1/6
-XX:MaxPermSize=16m:设置持久代大小为 16m。
-XX:MaxTenuringThreshold=0:设置垃圾最大年龄。如果设置为 0 的话,则年
轻代对象不经过 Survivor 区,直接进入年老代。对于年老代比较多的应用,可
以提高效率。如果将此值设置为一个较大值,则年轻代对象会在 Survivor 区进
行多次复制,这样可以增加对象再年轻代的存活时间,增加在年轻代即被回收
的概论。
二、垃圾回收策略调优
垃圾回收的设置也是在 catalina.sh 中,调整 JAVA_OPTS 变量。
具体设置如下:
JAVA_OPTS="$JAVA_OPTS -Xmx3550m -Xms3550m -Xss128k -
XX:+UseParallelGC -XX:MaxGCPauseMillis=100"
具体的垃圾回收策略及相应策略的各项参数如下:
串行收集器(JDK1.5 以前主要的回收方式)
-XX:+UseSerialGC:设置串行收集器
并行收集器(吞吐量优先)
示例:
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -
XX:MaxGCPauseMillis=100
-XX:+UseParallelGC:选择垃圾收集器为并行收集器。此配置仅对年轻代有
效。即上述配置下,年轻代使用并发收集,而年老代仍旧使用串行收集。
-XX:ParallelGCThreads=20:配置并行收集器的线程数,即:同时多少个线程
一起进行垃圾回收。此值最好配置与处理器数目相等。
-XX:+UseParallelOldGC:配置年老代垃圾收集方式为并行收集。JDK6.0 支持
对年老代并行收集
-XX:MaxGCPauseMillis=100:设置每次年轻代垃圾回收的最长时间,如果无法
满足此时间,JVM 会自动调整年轻代大小,以满足此值。
-XX:+UseAdaptiveSizePolicy:设置此选项后,并行收集器会自动选择年轻代
区大小和相应的 Survivor 区比例,以达到目标系统规定的最低相应时间或者收
集频率等,此值建议使用并行收集器时,一直打开。
并发收集器(响应时间优先)
示例:java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -
XX:+UseConcMarkSweepGC
-XX:+UseConcMarkSweepGC:设置年老代为并发收集。测试中配置这个以
后,-XX:NewRatio=4 的配置失效了,原因不明。所以,此时年轻代大小最好
用-Xmn 设置。
-XX:+UseParNewGC: 设置年轻代为并行收集。可与 CMS 收集同时使用。
JDK5.0 以上,JVM 会根据系统配置自行设置,所以无需再设置此值。
-XX:CMSFullGCsBeforeCompaction:由于并发收集器不对内存空间进行压
缩、整理,所以运行一段时间以后会产生“碎片”,使得运行效率降低。此值
设置运行多少次 GC 以后对内存空间进行压缩、整理。
-XX:+UseCMSCompactAtFullCollection:打开对年老代的压缩。可能会影响性
能,但是可以消除碎片
三、共享 session 处理
目前的处理方式有如下几种:
1).使用 Tomcat 本身的 Session 复制功能
参考 http://ajita.iteye.com/blog/1715312(Session 复制的配置)
方案的有点是配置简单,缺点是当集群数量较多时,Session 复制的时间会比
较长,影响响应的效率
2).使用第三方来存放共享 Session
目前用的较多的是使用 memcached 来管理共享 Session,借助于
memcached-sesson-manager 来进行 Tomcat 的 Session 管理
参考 http://ajita.iteye.com/blog/1716320(使用 MSM 管理 Tomcat 集群
session)
3).使用黏性 session 的策略
对于会话要求不太强(不涉及到计费,失败了允许重新请求下等)的场合,同
一个用户的 session 可以由 nginx 或者 apache 交给同一个 Tomcat 来处理,这
就是所谓的 session sticky 策略,目前应用也比较多
参考:http://ajita.iteye.com/blog/1848665(tomcat session sticky)
nginx 默认不包含 session sticky 模块,需要重新编译才行(windows 下我也不
知道怎么重新编译)
优点是处理效率高多了,缺点是强会话要求的场合不合适
四、添加 JMS 远程监控
对于部署在局域网内其它机器上的 Tomcat,可以打开 JMX 监控端口,局域网
其它机器就可以通过这个端口查看一些常用的参数(但一些比较复杂的功能不
支持),同样是在 JVM 启动参数中配置即可,配置如下:
-Dcom.sun.management.jmxremote.ssl=false -
Dcom.sun.management.jmxremote.authenticate=false
-Djava.rmi.server.hostname=192.168.71.38 设置 JVM 的 JMS 监控监听的 IP
地址,主要是为了防止错误的监听成 127.0.0.1 这个内网地址
-Dcom.sun.management.jmxremote.port=1090 设置 JVM 的 JMS 监控的端口
-Dcom.sun.management.jmxremote.ssl=false 设置 JVM 的 JMS 监控不实用
SSL
-Dcom.sun.management.jmxremote.authenticate=false 设置 JVM 的 JMS 监
控不需要认证
五、专业点的分析工具有
IBM ISA,JProfiler、probe 等,具体监控及分析方式去网上搜索即可
六、关于 Tomcat 的 的 session 数目
这个可以直接从 Tomcat 的 web 管理界面去查看即可 ;
或者借助于第三方工具 Lambda Probe 来查看,它相对于 Tomcat 自带的管理
稍微多了点功能,但也不多 ;
七、监视 Tomcat 的内存使用情况
使用 JDK 自带的 jconsole 可以比较明了的看到内存的使用情况,线程的状态,
当前加载的类的总量等;
JDK 自带的 jvisualvm 可以下载插件(如 GC 等),可以查看更丰富的信息。
如果是分析本地的 Tomcat 的话,还可以进行内存抽样等,检查每个类的使用
情况
八、打印类的加载情况及对象的回收情况
这个可以通过配置 JVM 的启动参数,打印这些信息(到屏幕(默认也会到
catalina.log 中)或者文件),具体参数如下:
-XX:+PrintGC:输出形式:[GC 118250K->113543K(130112K), 0.0094143 secs] [Full GC 121376K->10414K(130112K), 0.0650971 secs] -XX:+PrintGCDetails:输出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] [GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]
-XX:+PrintGCTimeStamps -XX:+PrintGC:PrintGCTimeStamps 可与上面两个
混合使用,输出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960
secs]
-XX:+PrintGCApplicationConcurrentTime:打印每次垃圾回收前,程序未中断
的执行时间。可与上面混合使用。输出形式:Application time: 0.5291524
seconds
-XX:+PrintGCApplicationStoppedTime:打印垃圾回收期间程序暂停的时间。
可与上面混合使用。输出形式:Total time for which application threads were
stopped: 0.0468229 seconds
-XX:PrintHeapAtGC: 打印 GC 前后的详细堆栈信息
-Xloggc:filename:与上面几个配合使用,把相关日志信息记录到文件以便分析
-verbose:class 监视加载的类的情况
-verbose:gc 在虚拟机发生内存回收时在输出设备显示信息
-verbose:jni 输出 native 方法调用的相关情况,一般用于诊断 jni 调用错误信息