什么是调优
- 根据需求进行jvm规划和预调优
- 优化运行的JVM运行环境
- 解决JVM运行过程中出现的各种问题
基础概念
吞吐量=用户代码执行时间/(用户代码执行时间+垃圾收集执行时间)
响应时间快=用户线程停顿时间(STW)短
确定调优之前,应该确定到底是哪个优先,是计算型任务还是响应型任务
科学计算、数据挖掘,都是吞吐量优先,用PS+PO
网站、GUI、API 响应优先,1.8尽量选G1
区分概念:
- 内存泄漏 memory leak。内存被无用对象占用,不一定会移除
- 内存溢出out of memroy
常用命令行
- java -Xmn10M -Xms40M -Xmx40M -XX:+PrintCommandLineFlags -XX:+PrintGC HelloGC
- Xmn 新生代大小
- Xms 堆最小大小 Xmx 堆最大大小
- HelloGC 类名
- XX:+PrintGC打印GC。可替换为PrintGCDetails打印GC更详细的日志,PrintGCTimeStamps打印GC时间 PrintGCCauses打印GC产生的原因
- java -XX:+UseConcMarkSweepGC -XX:PrintCommandLineFlags -XX:+PrintGC HelloGC
- UseConcMarkSweepGC 采用CMS GC
- java -XX:+PrintFlagsInitial 默认参数值
- java -XX:+PrintFlagsFinal 最终参数值
- java -XX:+PrintFlagsFinal |grep xxx 找到对应的参数
- java -XX:+PrintFlagsFinal -version |grep GC
日志格式
total = eden + 一个from或者to,因为from/to,每次只用一个。
调优之前的规划
- 调优要从实际的业务场景开始
- 要有监控(压力测试,能看到调优的反馈)
- 步骤
- 熟悉业务场景(没有最好的垃圾回收器,只有最合适的)
- 响应时间
- 吞吐量
- 选择回收器组合
- 计算内存需求
- 选定cpu,越高越好
- 设定年代大小、升级年龄
- 设置日志参数
- 熟悉业务场景(没有最好的垃圾回收器,只有最合适的)
实际题目:
- 有一个50w pv的资料查询网站,原服务器32位 1.5g堆内存,很慢,提升至64位 16G,结果更慢了,为什么?
- 为什么慢原因:慢是因为很多用户加载数据,都放到内存中,频繁的GC,STW长。
- 提升之后为什么更慢:内存大了,FGC耗时更久
- 咋办?ps换成PN+CMS,或者用G1
- CPU经常100%,怎么调优?(面试高频)
- cpu100%一定是有线程占用系统资源
- 找出哪个进程cpu高(top命令)
- 该进程中的哪个线程cpu高(top -Hp命令)
- 导出该线程的堆栈(jstack)
- 查找哪个方法(栈帧)消耗高(jstack)
- 工作线程占比高 | 垃圾线程占比高
- cpu100%一定是有线程占用系统资源
- 内存飙高,怎么调优?(面试高频)
- 导出堆内存(jamp命令)
- 分析(jhat、jvisualvm、mat、jprofiler...)
- 如何监控jvm
- jstat、jvisualvm、jprofiler、arthas、top...
具体调优:
- top 找到高cpu、内存消耗的进程
- top -Hp pid 找到这个进程中的所有线程,看哪个cpu和内存占用高
- jstack pid, (jstack里面的线程号是16进制的)定位线程状况
- 重点关注:waitting blocked
- eg.等待锁释放
- jvisualvm 连接服务器,可以直接看到图形化的性能(JXM启动java才行,但是影响效率)。。jprofiler最好用但是收费
怎么定位oom?
- 用命令行cmdline、arthas。。
- jmap histo pid | head 20 直接查看前20个的线程情况,查找有多少对象。有一定影响
- jmap dump:format=b,file=xxx pid,堆转储(把jmap信息导出成文件xxx),当是线上系统时,内存特别大,jmap执行期间会对进程产生很大影响,甚至卡顿(电商不适用)
- 说法一:设定了参数-XX:+HeadDumpOnOutOfMemoryError,OOM的时候会自动产生堆转储文件。
- 说法二(推荐):很多服务器备份(高可用),停掉这台服务器对其他服务器不影响,
- 说法三:arthas在线排查(一般小点的公司用不到)
- 图形界面有没有用,用到什么地方?测试!测试的时候进行监控
arthas 在线调优
- 下载,Arthas Install — Arthas 3.5.4 文档,解压后进入文件夹,java -jar arthas-boot.jar ,启动后输入要定位的java进程的序号
- 命令解释
- jvm 观察jvm信息,类似于jinfo
- thread 定位线程问题,类似于jstack
- dashboard 观察系统情况,类似于top
- heapdump 堆转储,类似于jstack dump,对主进程有影响
- 导出的文件用jhat -J-mx512M filename解析
- 也可以用MAT或者Jvisualvm装载文件,Jvisualvm比较好用
- jad 反编译
- 动态代理生成类的问题定位
- 第三方的类(观察代码)
- 版本问题,确定自己提交的代码是不是被使用
- redefine java.class 热替换
- 限制:只能改方法实现(方法已经运行完成),不能改方法名,不能改属性
案例汇总
oom产生的原因很多,程序有些未必产生oom,但是不断fgc,但是cpu飙高回收的内存很少
- 硬件升级导致卡顿。原因:fgc间隔变长,但是每一次fgc时间更长。所以需要选择合适的垃圾回收器
- 线程池不当运行产生OOM问题
- 不断往list添加对象(太low)
- lambda表达式产生的动态类,方法区溢出。
- server.max-http-header-size设置成100000,然后并发多次请求,会oom,因为每个http对象头都会占用这么大的内存。http11OutPutBuffer对象
- 直接内存溢出。使用了unsafe,或者使用NIO的问题
- 栈溢出,-Xss太小