【案例67】Npart批量启动服务卡顿严重分析过程

问题现象

通过Npart启动NC服务,发现只启动一个,大概3min左右即可启动成功。但是批量启动服务需要几十分钟才可以把服务启动成功,启动卡在获取“wenjian”图标处。

绕过Npart直接写脚本并行启动相关服务,发现也需要30min+

问题分析

查看nc-log.log发现有大量报错:获取参数FIP020失败,根据CPU个数获取最大线程数,请检查参数配置。

怀疑是JVM参数配置异常导致,故检查JVM参数发现现有参数配置

### xxx为打码路径,请找自己环境的路径

-server 
-Xmx8196m 
-XX:MetaspaceSize=512m 
-XX:MaxMetaspaceSize=1536m 
-Dsun.reflect.noInflation=true 
-Dsun.reflect.inflationThreshold=0 
-Djava.awt.headless=true 
-Duser.timezone=GMT+8 
-Dlog4j.ignoreTCL=true 
-Dfile.encoding=UTF-8 
-Djava.lang.string.substring.nocopy=true
-XX:+HeapDumpOnOutOfMemoryError 
-XX:HeapDumpPath=/xxx/outofmemory.hprof 
-XX:+PrintGCDateStamps 
-Xloggc:/xxx/gc.log 
-Dsun.reflect.inflationThreshold=0 
-XX:+HeapDumpOnOutOfMemoryError 
-XX:HeapDumpPath=/xxx/outofmemory.hprof 
-XX:+PrintGCDateStamps 
-Xloggc:/xxx/gc.log 
-Dnc.ds.conn.recordUseTrace=true

仔细排查发现下列参数加载了2次

-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/xxx/outofmemory.hprof -XX:+PrintGCDateStamps -Xloggc:/xxx/gc.log

去掉相关参数,部署参数到sysconfig中,再次通过Npart批量重启发现。服务启动速度提升2倍,但也需要10min左右。 再次观察启动日志发现,启动卡在连接数据库层面。

通过checkDB脚本测试,正常应该5s钟有返回值,但是通过测试发现大概1min才会有结果返回。

查询数据库,发现数据库中有大量的ORA报错。顾问反馈数据库本身IO等有问题,最近准备重做数据库。故先不解决。

后续顾问找到了个脚本查询了应用服务器到数据库服务器创立链接的时间大概都需要40s+。

 

解决方案

把多余补充的参数去除,启动速度客户可接受。后续重做数据库,启动速度还会有所提升。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值