衷心建议读者阅读源码,这篇内容比较简单。
openJDK9开始,String的底层实现不一样了,具体内容如下。
1.openJDK8的String
先来看下openJDK8的String的底层,如下图1.1所示:
图1.1 底层上使用的是char[],即char数组
每个char占16个bit,Character.SIZE的值是16。
2.openJDK9中的String
图2.1 openJDK9的底层上使用byte[]
openJDK9中这么设计的原因,是因为大部分的String其实是Latin-1,如果熟悉ASCII之类的编码就好理解了,Latin-1只是占有了很少的bit位,用char来存储浪费了很多的空间。
openJDK9中,字符如果是Latin-1,那么只用一个byte来存储,否则用俩个byte来存储。图2.1中的coder的值只有俩个,即LATIN1或者UTF16,如下图2.2所示
图2.2
来看个有特点的方法,charAt(index),在openJDK9上是怎么实现的,如下图2.3所示,时序图如下图2.4所示:
图2.3 openJDK9中charAt(index)的实现
图2.4
注:图2.4中步骤3和步骤5是if-else的关系,没怎么画对。
图2.5 StringLatin1的charAt的实现
图2.6 StringUTF16中charAt的实现
注:图2.6中StringUTF16的charAt实现较为复杂,因为它要从byte[]数组中取出俩个byte,组为char。
3.openJDK9中的AbstractStringBuilder
openJDK9中,AbstractStringBilder的底层上也是用了byte[],如下图3.1所示:
图3.1 AbstractStringBuilder的底层上也是byte[]
AbstractStringBuilder的底层上使用byte[],意味着StringBuilder和StringBuffer用的也是byte[],为什么这么说,因为StringBuilder和StringBuffer继承自AbstractStringBuilder。
建议读者阅读源码。