最近工作中对系统进行调优,发现有一个后台任务执行后会导致logger打日志会变得很慢。经过层层分析,发现是任务代码中用到的阿里巴巴的fastjson框架中的SymbolTable对象中有大量String intern对象。
参考:http://tech.meituan.com/in_depth_understanding_string_intern.html
因为GC优化比较难搞,所以我们先从String.intern()的开销开始做。String.intern()的作用就是在JVM运行时往常量池去写东西,如果intern的String已经存在,返回已存在的地址,如果不存在,往常量池写一份,再返回常量池中的地址,来减少String的实例数。
StringTable的结构类似于一个HashMap,默认大小1009,当JVM中存在大量的String并且intern时,这个大小会导致严重的哈希冲突,接下来的结果相信大家都知道了,某些Entry的链表可能非常长,导致HashMap的性能下降非常多。
这个在JDK7或者淘宝的JDK6最新版中提供了一个启动参数-XX:StringTableSize=N来设定StringTable的大小,通过扩张Table来减少Hash冲突。
更新一步,实际上序列化/反序列化的过程中会大量调用String.intern(),主要是ClassName、MethodSignature、FieldName等等这些类信息,都会用String.intern()来保证每次用同一个实例。导致的后果就是Table太小,性能的指数下降。
jdk1.7可以设置-XX:StringTableSize参数
http://xmlandmore.blogspot.com/2013/05/understanding-string-table-size-in.html