String 是java 程序员在日常开发中使用得最频繁的对象,本文是继之前写过的一部分以及最近复习后理解和体会记录在此,以便加深印象和沉淀技术,本文是基于jdk1.8中的String 源码,有说得不对的地方,欢迎大家评论指正,共创中国技术力量;闲话不多说,我们这就开始了。
一、String 结构介绍
-
String 类的定义
从图上可以看出,String 是一个final 类,所以没办法再做继承和修改;实现了Serializable/Comparable/CharSequence 接口,这些接口都有对应的一些功能,可供String 类使用. -
Serializable 接口
从图中可以看出,Serializable接口是在java.io 包下,io 包在JDK1.1 的时候就已经存在了, 说明在最初设计java 语言的时候就已经考虑到了数据传输序列化和反序列化问题,从第一张String类图中就可以看出,实现Serializable 接口需要写一个SUID版本号,可以看到,这个版本号足够大,就能避免重复,相信也有人看到过 ,把这个版本号写为:1L , 这通常是开发者自己手写的,正常应该由编辑器生成,因为编辑器生成是这个值是取的源类的哈希值,这个版本号是为了让对象在在传输过程前后能进行序列化和反序列化,换句话说就能找到对应的类。 -
Comparable 接口
此接口也只有一个方法,看一下String 类的实现
可以看出,compareTo 方法先拿到了目标字符串和对比字符串的char 数组的length(长度),然后取长的一个,用于循环次数,循环取数组中的每一个元素(char) 的十进制ASCll 码进行对比,只要有不相等的直接返回,返回的值大于零小于零都说明不相等,只有当他们的每一个元素都相等,最后长度相减也等于零的时候才说明他们是同一个字符串,这里我之前在看的时候有个疑问,为什么不对比内存地址呢,因为eques 就是通过判断地址是不是样,从而来判断是不是同一个对象,在后面的jvm 存储原理的时候我会讲到它们为什么不对比内存地址,而是要一个字符一个字符的对比。
二、String 核心(常用)方法
-
getBytes()
获取字符串对象的byte 数组
注释大致的意思是说,使用指定的字符集编码这个字符串,将字符串编码后的十进制ASCll放入一个新的数组中返回,这里说的是字符串编码,其实在很多网络传输场景都需要编解码。在后续的文章中会慢慢讲到。 -
hashCode()
获取对象的hashCode
hashCode 是Object 类的方法,很明显,String 重写了,hash 值只有当使用new String(“abc”) 这个构造函数才会为其赋值,其他构造方法一开始都是没有值的,所以这里要判断是否等于0 ,因为int 的默认值为0;**s[0]31^(n-1) + s[1]31^(n-2) + … + s[n-1] 算法可能结合代码,能更让人容易理解,就是用31 乘当前的hash值,然后再加上当前对象的第n个char 元素的ASCll 值,直至循环完,最终的值就是当前字符串的hashCode ,可能有很多人不知道为什么是乘以31,是因为hashCode是int类型,而int 的取值范围是:【-2的31次方(-2147483648),2的31次方减一(2147483647)】,它在内存中是以补码(对应正数的二进制位取反,加1)的形式存储的,当超过最大值时,会去反得到int类型的附属位。 -
其他方法基本都是一些构造函数和功能方法,需要什么样的功能直接使用就可以了,感兴趣也可以去阅读一下源码。
三、String JVM存储实现原理
由于String 类是一个特殊的类型,就连jvm 都为其做了特殊的设计,专门为String 类在jvm堆内存中开辟了一块空间用于存放数据,这个区域叫做:字符串常量池,每次当有字符串被创建时,jvm 会先去字符串常量池检查有没有这个字符串,如果有就直接返回内存地址,没有才会开辟一块内存用于存放新的值,所以,一个字符串在内存中只会有一份,所以前面就有说到,compareTo为什么不对比地址了,是因为对比的维度不同,所以没有必要。
想了解String 在jvm 内存区域存储的形式,可以阅读https://blog.csdn.net/alexwym/article/details/81091988 这篇博客,我觉得博主说的比较详细,也可以自己动手验证一下,但前提是需要对jvm 内存区域有所了解。
四、总结
String 在java 中是一个特殊的类,也是我们代码中用得最频繁的类型之一,所以看看源码实现对java 的设计会有一定的认识,在以后的开发工作中也会清楚要如何合理使用String 类型。