问题描述
在xqp上部署之后报StackOverFlow错误。根据localhost-2020-12-31.log初步判断是日志有关的jar包循环调用导致的。但是奇怪的是线上没有问题,有些xqp机器也没问题。后来在网上查阅资料发现这是由于jar加载顺序不同导致的。
分析
以log4j-1.2.17
和log4j-over-slf4j-1.7.14
这两个包为例,如果jvm先加载log4j-1.2.17
后加载log4j-over-slf4j-1.7.14
就不会出现递归调用,也不会出现StackOverflow。反之则会报错。
那么为什么加载顺序不同会导致这种差异呢?其原因在
org.apache.log4j.LogManager
这个类上。这个类的全类名在上述两个包中都存在,jvm先加载哪个包就会使用哪个包下的org.apache.log4j.LogManager
。简单的说,就是这两个包加载顺序不同会印象程序运行时使用哪个org.apache.log4j.LogManager
,从而产生差异。
解决方案
由于线上使用的是tomcat8,xqp上使用的是tomcat7。而tomcat8默认按照字典序加载jar包,所以tomcat8应该可以保证log4j-1.2.17
先被加载,所以线上一直没出过类似问题。
可以考虑将xqp从tomcat7换成tomcat8。或者再花些时间研究一下为啥有的xqp机器即使使用的是tomcat7依然可以正常运行,有的却不能。
stackoverflow中介绍了加载顺序
Order for loaded jars in WEb-INF/lib folder.
For tomcat 5-7 the order is alphabetical. It uses sort.
For tomcat 8 is random decided by underlying file system.
翻译过来就是5-7的tomcat按照字典序加载,8按照底层文件系统加载。
如果是在xqp上,可以考虑换一台机器。大多数机器的文件系统都可以先加载log4j-1.2.17
。
如果是其他环境,需要考虑配置tomcat的context.xml文件,在其中指定加载顺序。
或者还有一个解决方案。分析之后发现目前工程中使用的是log4j2,不需要log4j,所以可以删除log4j-1.2.17
的引用
删除之后竟然还报错
实验
代码
package test;
/**
* 模拟出audit中有关log的StackOverFlow现象
*/
public class HelloWorld {
public static void main(String[] args) {
org.apache.log4j.BasicConfigurator.configure();
org.slf4j.Logger logger = org.slf4j.LoggerFactory
.getLogger(HelloWorld.class);
logger.info("Hello World");
}
}
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.example</groupId>
<artifactId>testLog</artifactId>
<version>1.0-SNAPSHOT</version>
<properties>
<slf4j.version>1.7.14</slf4j.version>
</properties>
<dependencies>
<!-- https://mvnrepository.com/artifact/org.slf4j/slf4j-log4j12 -->
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-log4j12</artifactId>
<version>1.6.1</version>
<!-- <scope>test</scope>-->
</dependency>
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-api</artifactId>
<version>${slf4j.version}</version>
</dependency>
<!-- <!– https://mvnrepository.com/artifact/log4j/log4j –>-->
<!-- <dependency>-->
<!-- <groupId>log4j</groupId>-->
<!-- <artifactId>log4j</artifactId>-->
<!-- <version>1.2.17</version>-->
<!-- </dependency>-->
<!-- <!– https://mvnrepository.com/artifact/org.slf4j/log4j-over-slf4j –>-->
<!-- <dependency>-->
<!-- <groupId>org.slf4j</groupId>-->
<!-- <artifactId>log4j-over-slf4j</artifactId>-->
<!-- <version>${slf4j.version}</version>-->
<!-- </dependency>-->
</dependencies>
</project>
除此之外,还要通过手动加载jar,控制log4j-1.2.17
和log4j-over-slf4j-1.7.14
的加载顺序
现象
log4j-1.2.17
在后
调用的是log4j-over-slf4j-1.7.14
的代码,会报错
错误信息
D:\software\java\java\bin\java.exe -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:57461,suspend=y,server=n -javaagent:C:\Users\L\AppData\Local\JetBrains\IntelliJIdea2020.1\captureAgent\debugger-agent.jar -Dfile.encoding=UTF-8 -classpath "D:\software\java\java\jre\lib\charsets.jar;D:\software\java\java\jre\lib\deploy.jar;D:\software\java\java\jre\lib\ext\access-bridge-64.jar;D:\software\java\java\jre\lib\ext\cldrdata.jar;D:\software\java\java\jre\lib\ext\dnsns.jar;D:\software\java\java\jre\lib\ext\jaccess.jar;D:\software\java\java\jre\lib\ext\jfxrt.jar;D:\software\java\java\jre\lib\ext\localedata.jar;D:\software\java\java\jre\lib\ext\nashorn.jar;D:\software\java\java\jre\lib\ext\sunec.jar;D:\software\java\java\jre\lib\ext\sunjce_provider.jar;D:\software\java\java\jre\lib\ext\sunmscapi.jar;D:\software\java\java\jre\lib\ext\sunpkcs11.jar;D:\software\java\java\jre\lib\ext\zipfs.jar;D:\software\java\java\jre\lib\javaws.jar;D:\software\java\java\jre\lib\jce.jar;D:\software\java\java\jre\lib\jfr.jar;D:\software\java\java\jre\lib\jfxswt.jar;D:\software\java\java\jre\lib\jsse.jar;D:\software\java\java\jre\lib\management-agent.jar;D:\software\java\java\jre\lib\plugin.jar;D:\software\java\java\jre\lib\resources.jar;D:\software\java\java\jre\lib\rt.jar;D:\software\maven\my_repo\org\slf4j\log4j-over-slf4j\1.7.14\log4j-over-slf4j-1.7.14.jar;D:\software\maven\my_repo\log4j\log4j\1.2.17\log4j-1.2.17.jar;D:\data\BianCheng\java\testLog\target\classes;D:\software\maven\my_repo\org\slf4j\slf4j-log4j12\1.6.1\slf4j-log4j12-1.6.1.jar;D:\software\maven\my_repo\log4j\log4j\1.2.16\log4j-1.2.16.jar;D:\software\maven\my_repo\org\slf4j\slf4j-api\1.7.14\slf4j-api-1.7.14.jar;D:\software\idea\idea\IntelliJ IDEA 2020.1\lib\idea_rt.jar" test.HelloWorld
Connected to the target VM, address: '127.0.0.1:57461', transport: 'socket'
Exception in thread "main" java.lang.StackOverflowError
at java.util.concurrent.ConcurrentHashMap.get(ConcurrentHashMap.java:936)
at org.apache.log4j.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:39)
at org.apache.log4j.LogManager.getLogger(LogManager.java:45)
at org.slf4j.impl.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:73)
at org.slf4j.LoggerFactory.getLogger(LoggerFactory.java:295)
at org.apache.log4j.Category.<init>(Category.java:57)
at org.apache.log4j.Logger.<init>(Logger.java:37)
at org.apache.log4j.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:43)
at org.apache.log4j.LogManager.getLogger(LogManager.java:45)
at org.slf4j.impl.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:73)
at org.slf4j.LoggerFactory.getLogger(LoggerFactory.java:295)
at org.apache.log4j.Category.<init>(Category.java:57)
at org.apache.log4j.Logger.<init>(Logger.java:37)
at org.apache.log4j.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:43)
at org.apache.log4j.LogManager.getLogger(LogManager.java:45)
at org.slf4j.impl.Log4jLoggerFactory.getLogger(Log4jLoggerFactory.java:73)
at org.slf4j.LoggerFactory.getLogger(LoggerFactory.java:295)
at org.apache.log4j.Category.<init>(Category.java:57)
at org.apache.log4j.Logger.<init>(Logger.java:37)
下面省略很多行
log4j-1.2.17
在前
调用log4j-1.2.17
中的LogManager
程序正常结束
D:\software\java\java\bin\java.exe -agentlib:jdwp=transport=dt_socket,address=127.0.0.1:57514,suspend=y,server=n -javaagent:C:\Users\L\AppData\Local\JetBrains\IntelliJIdea2020.1\captureAgent\debugger-agent.jar -Dfile.encoding=UTF-8 -classpath "D:\software\java\java\jre\lib\charsets.jar;D:\software\java\java\jre\lib\deploy.jar;D:\software\java\java\jre\lib\ext\access-bridge-64.jar;D:\software\java\java\jre\lib\ext\cldrdata.jar;D:\software\java\java\jre\lib\ext\dnsns.jar;D:\software\java\java\jre\lib\ext\jaccess.jar;D:\software\java\java\jre\lib\ext\jfxrt.jar;D:\software\java\java\jre\lib\ext\localedata.jar;D:\software\java\java\jre\lib\ext\nashorn.jar;D:\software\java\java\jre\lib\ext\sunec.jar;D:\software\java\java\jre\lib\ext\sunjce_provider.jar;D:\software\java\java\jre\lib\ext\sunmscapi.jar;D:\software\java\java\jre\lib\ext\sunpkcs11.jar;D:\software\java\java\jre\lib\ext\zipfs.jar;D:\software\java\java\jre\lib\javaws.jar;D:\software\java\java\jre\lib\jce.jar;D:\software\java\java\jre\lib\jfr.jar;D:\software\java\java\jre\lib\jfxswt.jar;D:\software\java\java\jre\lib\jsse.jar;D:\software\java\java\jre\lib\management-agent.jar;D:\software\java\java\jre\lib\plugin.jar;D:\software\java\java\jre\lib\resources.jar;D:\software\java\java\jre\lib\rt.jar;D:\software\maven\my_repo\log4j\log4j\1.2.17\log4j-1.2.17.jar;D:\software\maven\my_repo\org\slf4j\log4j-over-slf4j\1.7.14\log4j-over-slf4j-1.7.14.jar;D:\data\BianCheng\java\testLog\target\classes;D:\software\maven\my_repo\org\slf4j\slf4j-log4j12\1.6.1\slf4j-log4j12-1.6.1.jar;D:\software\maven\my_repo\log4j\log4j\1.2.16\log4j-1.2.16.jar;D:\software\maven\my_repo\org\slf4j\slf4j-api\1.7.14\slf4j-api-1.7.14.jar;D:\software\idea\idea\IntelliJ IDEA 2020.1\lib\idea_rt.jar" test.HelloWorld
Connected to the target VM, address: '127.0.0.1:57514', transport: 'socket'
0 [main] INFO test.HelloWorld - Hello World
Disconnected from the target VM, address: '127.0.0.1:57514', transport: 'socket'
Process finished with exit code 0
总结
如果包中有相同的类(全类名完全相同),那么jvm先加载哪个包就使用哪个包下的类。这涉及到双亲委派机制。
加载器准备加载一个类->此加载器检查类是否已经加载,如果已经加载直接返回,反之询问父加载器有没有加载过这个类->递归向上调用父加载器,如果到最上面那个加载器依然没找到已经加载的同名类,就交给最先提到的那个加载器去加载。
注意上面的如果已经加载直接返回,因为这个原因,后加载的包中的类无法覆盖之前已经加载的类。
参考博客
曹工改bug–这次,我遇到了一个难缠的栈溢出bug,还是日志相关的,真的难
详解log4j-over-slf4j与slf4j-log4j12共存stack overflow异常分析