# 背景说明
前段时间,部署在Tomcat中的应用在生产环境首次出现CPU持续爆满且长期不释放资源的情况,由于没有任何JVM监控组件,只能以Java提供的工具命令jps、jstack的进行诊断,非常不便.
因此,引入VisualVM做JVM监控。VisualVM是Oracle提供的JVM可视化工具,Windows、Linux、Mac版本都有。官网 有详细的介绍,[项目](https://visualvm.github.io) 已转移到github
本文以排查 ubuntu server CPU爆满情况为例 介绍VisualVM的使用。
# Demo
## 定位CPU爆满原因
通过linux top命令可以立即定位到占用CPU最高的进程:tomcat.
## 服务器配置JMX连接端口
`VisualVM支持jstatd和JMX两种连接方式`
配置以下JVM环境变量,可以配置在 tomcat/bin/setenv.sh中
```shell
export JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.port=2099 -Dcom.sun.management.jmxremote.rmi.port=2099 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Djava.rmi.server.hostname=183.131.145.xxx"
```
配置说明
* -Dcom.sun.management.jmxremote.port MX远程连接端口
* -Dcom.sun.management.jmxremote.ssl=false 不启用SSL
* -Dcom.sun.management.jmxremote.authenticate=false 不需要验证授权
* -Djava.rmi.server.hostname :服务器IP
## 使用VisualVM
下载VisualVM后,添加一个JMX连接。打开后可以查看CPU、堆内存、PermGen等总体数据
![](https://blog-1256695615.cos.ap-shanghai.myqcloud.com/2018/03/19/736576d439bd4d798874bdb7bf87a5ad.png)
下图是所有线程的情况,获取线程dump数据,分析哪些线程一直处于RUNNABLE状态,该线程处于哪段代码位置,再结合该处代码所涉及的业务情况进行分析,解决问题即可。
![](https://blog-1256695615.cos.ap-shanghai.myqcloud.com/2018/03/19/034ca8789d614a6499868d5576e9ca1e.png)
## 使用Java工具定位问题
在未配置VisualVM的情况下,也可以通过Java提供的小工具来定位问题,这里简述一下。
* 通过linux top命令获取占用CPU很高的进程ID即 pid
* ps -mp pid -o THREAD,tid,time 打印出该进程下的线程占用cpu情况,找到运行时间较长的线程的id即 tid
![](https://blog-1256695615.cos.ap-shanghai.myqcloud.com/2018/03/19/5113dc003fd04d86a325fe4613ef93da.png)
* 将线程ID转换为16进制格式: printf "%x\n" tid
* 最后打印线程的堆栈信息:jstack pid |grep tid -A 30
其中nid就是16进制的tid
![](https://blog-1256695615.cos.ap-shanghai.myqcloud.com/2018/03/19/06bb52ed63394fab86b11ea43dcdd7b1.png)
扫码或搜索 codercyj 关注微信公众号, 结伴学习, 一起努力