JVM找出导致CPU使用率过高的Java代码

如何查看占用cpu较高的线程?
1.使用top+jstack命令
1.1.什么是top?什么是jstack?
1.1.1. top:top命令经常用来监控Linux的系统状况,比如cpu、内存的使用。
如下图所示:简单的使用top命令打出以下信息

** 上图各个名词说明:**

top - 11::00:41[当前系统时间]

106 days[系统已经运行了06天]

9 user[9个用户当前登录]

load average: 0.00, 0.02, 0.00[系统负载,即任务队列的平均长度]

Tasks: 140 total[总进程数]

1 running[正在运行的进程数]

139 sleeping[睡眠的进程数]

0 stopped[停止的进程数]

0 zombie[冻结进程数]

Cpu(s):0.5%us[用户空间占用CPU百分比]

0.7%sy[内核空间占用CPU百分比]

0.0%ni[用户进程空间内改变过优先级的进程占用CPU百分比]

98.8%id[空闲CPU百分比], 0.0%wa[等待输入输出的CPU时间百分比]

0.0%hi[hi hard interrupt 表示处理硬中断的CPU时间比例]

0.0%si [soft interrupt 表示处理软中断的CPU时间比例]

0.0%st[表示当前系统运行在虚拟机中的时候,被其他虚拟机占用的CPU时间比例]

Mem: 3400 total[物理内存总量]

1039.1 used[使用的物理内存总量]

466.1 free[空闲内存总量]

1894.8 buffers[用作内核缓存的内存量]

Swap: 0.0 total[交换区总量]

0.0 used[使用的交换区总量]

0.0 free[空闲交换区总量]

2069.3 cached[缓冲的交换区总量]

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 


PID 进程ID

USER 进程所有者的用户名,例如root

PR 进程调度优先级

NI 进程nice值(优先级),越小的值代表越高的优先级

VIRT 进程使用的虚拟内存

RES 进程使用的物理内存(不包括共享内存)

SHR 进程使用的共享内存

CPU 进程使用的CPU占比

MEM 进程使用的内存占比

TIME 进程启动后到现在所用的全部CPU时间

COMMAND 进程的启动命令(默认只显示二进制,top -c能够显示命令行和启动参数)

关于top相关的命令可以去网上搜索下如何使用,这里不做解释。

1.1.2.jstack是java虚拟机自带的一种堆栈跟踪工具
jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。

另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。

它的主要功能:

a. 针对活着的进程做本地的或远程的线程dump;

b. 针对core文件做线程dump。

So,jstack命令主要用来查看Java线程的调用堆栈的,可以用来分析线程问题(如死锁)。

2.如何使用top+jstack分析线程状态
2.1.找到项目和进程id
使用top命令(查找出哪个进程和项目消耗的cpu高 如下图所示所查出结果)

top -c

如图所示 我们找到了项目nacos的进程id:974780

2.2.查找出该进程下哪个线程消耗的cpu高
使用top命令( 显示该进程下的消耗cpu高的线程)

top -H -p [进程PID]

比如输入

top -H -p 974780

如图所示 找到了线程id:974927

接下来把此线程id转换为16进制可以输入命令进行转换 如下
printf "%x\\n" 【线程id】

printf "%x\\n"  974927

也可以使用工具链接进制转换 - 在线工具转换,拿到我们转换为16进制的线程id:ee04f

2.3.使用jstack查找这个线程的信息
输入命令
jstack [进程id]|grep -A 20 [线程id的16进制] 
输入如:

jstack 974780 | grep -A 20 ee04f

找到线程信息然后结合线程状态分析原因。

3. jstack怎么分析线程?
3.1.1.线程状态

NEW,未启动的。不会出现在Dump中。

RUNNABLE,在虚拟机内执行的。运行中状态,可能里面还能看到locked字样,表明它获得了某把锁。

BLOCKED,受阻塞并等待监视器锁。被某个锁(synchronizers)給block住了。

WATING,无限期等待另一个线程执行特定操作。等待某个condition或monitor发生,一般停留在park(), wait(), sleep(),join() 等语句里。

TIMED\_WATING,有时限的等待另一个线程的特定操作。和WAITING的区别是wait() 等语句加上了时间限制 wait(timeout)。

TERMINATED,已退出的。
3.1.2.Monitor
在多线程的 JAVA程序中,实现线程之间的同步,就要说说 Monitor。 Monitor是 Java中用以实现线程之间的互斥与协作的主要手段,它可以看成是对象或者 Class的锁。每一个对象都有,也仅有一个 monitor。下 面这个图,描述了线程和 Monitor之间关系,以 及线程的状态转换图:


进入区(Entrt Set):表示线程通过synchronized要求获取对象的锁。如果对象未被锁住,则迚入拥有者;否则则在进入区等待。一旦对象锁被其他线程释放,立即参与竞争。

拥有者(The Owner):表示某一线程成功竞争到对象锁。

等待区(Wait Set):表示线程通过对象的wait方法,释放对象的锁,并在等待区等待被唤醒。

从图中可以看出,一个 Monitor在某个时刻,只能被一个线程拥有,该线程就是 “Active Thread”,而其它线程都是 “Waiting Thread”,分别在两个队列 “ Entry Set”和 “Wait Set”里面等候。在 “Entry Set”中等待的线程状态是 “Waiting for monitor entry”,而在“Wait Set”中等待的线程状态是 “in Object.wait()”。 先看 “Entry Set”里面的线程。我们称被 synchronized保护起来的代码段为临界区。当一个线程申请进入临界区时,它就进入了 “Entry Set”队列。对应的 code就像:


synchronized(obj) {

.........

}
3.1.3.调用修饰
表示线程在方法调用时,额外的重要的操作。线程Dump分析的重要信息。修饰上方的方法调用。

> **locked <地址> 目标:使用synchronized申请对象锁成功,监视器的拥有者。**

> **waiting to lock <地址> 目标:使用synchronized申请对象锁未成功,在迚入区等待。**

> **waiting on <地址> 目标:使用synchronized申请对象锁成功后,释放锁幵在等待区等待。**

> **parking to wait for <地址> 目标**

**locked**

at oracle.jdbc.driver.PhysicalConnection.prepareStatement

- locked \<0x00002aab63bf7f58\> (a oracle.jdbc.driver.T4CConnection)

at oracle.jdbc.driver.PhysicalConnection.prepareStatement

- locked \<0x00002aab63bf7f58\> (a oracle.jdbc.driver.T4CConnection)

at com.jiuqi.dna.core.internal.db.datasource.PooledConnection.prepareStatement

通过synchronized关键字,成功获取到了对象的锁,成为监视器的拥有者,在临界区内操作。对象锁是可以线程重入的。

**waiting to lock**

at com.jiuqi.dna.core.impl.CacheHolder.isVisibleIn(CacheHolder.java:165)

- waiting to lock \<0x0000000097ba9aa8\> (a CacheHolder)

at com.jiuqi.dna.core.impl.CacheGroup$Index.findHolder

at com.jiuqi.dna.core.impl.ContextImpl.find

at com.jiuqi.dna.bap.basedata.common.util.BaseDataCenter.findInfo

通过synchronized关键字,没有获取到了对象的锁,线程在监视器的进入区等待。在调用栈顶出现,线程状态为Blocked。

**waiting on**

at java.lang.Object.wait(Native Method)

- waiting on \<0x00000000da2defb0\> (a WorkingThread)

at com.jiuqi.dna.core.impl.WorkingManager.getWorkToDo

- locked \<0x00000000da2defb0\> (a WorkingThread)

at com.jiuqi.dna.core.impl.WorkingThread.run


通过synchronized关键字,成功获取到了对象的锁后,调用了wait方法,进入对象的等待区等待。在调用栈顶出现,线程状态为WAITING或TIMED_WATING。

parking to wait for

park是基本的线程阻塞原语,不通过监视器在对象上阻塞。随concurrent包会出现的新的机制,不synchronized体系不同。

3.1.4.线程动作
线程状态产生的原因

> **runnable:状态一般为RUNNABLE。**

> **in Object.wait():等待区等待,状态为WAITING或TIMED_WAITING。**

> **waiting for monitor entry:进入区等待,状态为BLOCKED。**

> **waiting on condition:等待区等待、被park。**

> **sleeping:休眠的线程,调用了Thread.sleep()。**

Wait on condition 该状态出现在线程等待某个条件的发生。具体是什么原因,可以结合 stacktrace来分析。 最常见的情况就是线程处于sleep状态,等待被唤醒。 常见的情况还有等待网络IO:在java引入nio之前,对于每个网络连接,都有一个对应的线程来处理网络的读写操作,即使没有可读写的数据,线程仍然阻塞在读写操作上,这样有可能造成资源浪费,而且给操作系统的线程调度也带来压力。在 NewIO里采用了新的机制,编写的服务器程序的性能和可扩展性都得到提高。 正等待网络读写,这可能是一个网络瓶颈的征兆。因为网络阻塞导致线程无法执行。一种情况是网络非常忙,几 乎消耗了所有的带宽,仍然有大量数据等待网络读 写;另一种情况也可能是网络空闲,但由于路由等问题,导致包无法正常的到达。所以要结合系统的一些性能观察工具来综合分析,比如 netstat统计单位时间的发送包的数目,如果很明显超过了所在网络带宽的限制 ; 观察 cpu的利用率,如果系统态的 CPU时间,相对于用户态的 CPU时间比例较高;如果程序运行在 Solaris 10平台上,可以用 dtrace工具看系统调用的情况,如果观察到 read/write的系统调用的次数或者运行时间遥遥领先;这些都指向由于网络带宽所限导致的网络瓶颈。

3.1.5.案例分析
(1)运行一段简单代码

@GetMapping("/whileTest")
    public void whileTest() {
        while (true) {

            //Do Nothing

        }
    }

这里我写成接口形式了,放在了我的hmblogs服务里,

访问http://www.hmblogs.com.cn:8081/hmblogs/whileTest

该服务PID是570235

使用top命令查看,cpu使用率很高

jstack 570235


由此可见:**当前有很多线程处于runnable状态,可以根据项目包名搜出哪些代码行是开发人员写的,然后进一步分析原因。**

(2)再运行下一段代码

package com.hmblogs.backend.controller;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class ThreadController {

    @GetMapping("/whileTest")
    public void whileTest() {
        Thread thread = new Thread(new Thread1());
        thread.start();
    }

    class Thread1 implements Runnable {

        @Override
        public void run() {
            while (true) {
                System.out.println(11111);
            }
        }
    }
}

访问http://www.hmblogs.com.cn:8081/hmblogs/whileInThread

jstack 586351

打出堆栈信息

(3)死锁分析
啥叫死锁? 所谓死锁: 是指两个或两个以上的进程在执行过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程。 说白了,我现在想吃鸡蛋灌饼,桌子上放着鸡蛋和饼,但是我和我的朋友同时分别拿起了鸡蛋和饼子,我手里拿着鸡蛋,但是我需要他手里的饼。他手里拿着饼,但是他想要我手里的鸡蛋。就这样,如果不能同时拿到鸡蛋和饼,那我们就不能继续做后面的工作(做鸡蛋灌饼)。所以,这就造成了死锁。 看一段死锁的程序:

package com.hmblogs.backend.controller;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
public class DeadLockController {

    @GetMapping("/deadLockTest")
    public void whileTest() {
        Thread t1 = new Thread(new DeadLockclass(true));//建立一个线程

        Thread t2 = new Thread(new DeadLockclass(false));//建立另一个线程

        t1.start();//启动一个线程

        t2.start();//启动另一个线程

    }

}

class DeadLockclass implements Runnable {

    public boolean falg;// 控制线程

    DeadLockclass(boolean falg) {

        this.falg = falg;

    }

    public void run() {

        /*

         * 如果falg的值为true则调用t1线程

         */

        if (falg) {

            while (true) {

                synchronized (Suo.o1) {

                    System.out.println("o1 " + Thread.currentThread().getName());

                    synchronized (Suo.o2) {

                        System.out.println("o2 " + Thread.currentThread().getName());

                    }

                }

            }

        }

        /*

         * 如果falg的值为false则调用t2线程

         */

        else {

            while (true) {

                synchronized (Suo.o2) {

                    System.out.println("o2 " + Thread.currentThread().getName());

                    synchronized (Suo.o1) {

                        System.out.println("o1 " + Thread.currentThread().getName());

                    }

                }

            }

        }

    }

}

class Suo {

    static Object o1 = new Object();

    static Object o2 = new Object();

}

访问

http://www.hmblogs.com.cn:8081/hmblogs/deadLockTest
运行结果

我们发现,程序只输出了两行内容,然后程序就不再打印其它的东西了,但是程序并没有停止。这样就产生了死锁。 当线程1使用synchronized锁住了o1的同时,线程2也是用synchronized锁住了o2。当两个线程都执行完第一个打印任务的时候,线程1想锁住o2,线程2想锁住o1。但是,线程1当前锁着o1,线程2锁着o2。所以两个想成都无法继续执行下去,就造成了死锁。

我们使用jstack来看一下线程堆栈信息:



堆栈写的很明显,它告诉我们 Found one Java-level deadlock,然后指出造成死锁的两个线程的内容。然后,又通过 Java stack information for the threads listed above来显示更详细的死锁的信息。

补充

jstack命令可以用来生成Java应用程序的线程转储快照,包括每个线程的堆栈跟踪信息。我们可以通过观察线程的堆栈跟踪信息来判断哪些代码占用了CPU。

jstack 596917 > thread_dump.txt

其中,596917是Java应用程序的进程ID。执行以上命令后,会生成一个名为thread_dump.txt的文件,其中包含了线程转储快照的信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值