排查该问题的顺序:
- 检查系统资源限制:通过这个命令ulimit -u检查当前用户的资源使用最大线程数限制是多少,然后再使用ps -eLf | grep去查看一下是否和最大限制相当,如果是相差不大的话,得考虑两个问题,(1)系统控制最大线程数限制是否太小,一般情况下设置个10240基本可以满足需求,当然也要看业务场景和代码的情况。(2)如果确实已经非常大了如果还不够,那得考虑是否代码有问题,或者压力确实达到了一定值,得考虑扩容硬件了。如果当前用户创建的线程远没达到使用的上限,则往2再做考虑
- 查看当前java进程的线程数 ps -e -T | grep {pid},当前java能创建的线程数计算方式如下:
(MaxProcessMemory - JVMMemory - ReservedOsMemory) / (ThreadStackSize) = Number of threads
MaxProcessMemory 指的是一个进程的最大内存
JVMMemory JVM内存
ReservedOsMemory 保留的操作系统内存
ThreadStackSize 线程栈的大小在java语言里, 当你创建一个线程的时候,虚拟机会在JVM内存创建一个Thread对象同时创建一个操作系统线程,而这个系统线程的内存用的不是JVMMemory,而是系统中剩下的内存(MaxProcessMemory - JVMMemory - ReservedOsMemory)。 所以如果确实需要更多的线程来支撑业务的运行,得考虑把(MaxProcessMemory - JVMMemory - ReservedOsMemory)调整大,(a), MaxProcessMemory 使用64位操作系统
(b), JVMMemory 降低JVMMemory的分配,-Xmx
(c), ThreadStackSize 减小单个线程的栈大小或者每个线程默认的占用大小参数为-Xss,默认情况下是1024k也就是1M。如果这也还没解决的话那得真正的需要扩容。