java lr(0)如何实现移进和规约_Java编码的参考指南

01 开篇词:为什么学习本专栏

173f1f83c2561e2191f7fc780a51f69b.png

最聪明的人是最不愿浪费时间的人。——但丁

你好,我是明明如月,一个重视方法、喜欢思考的 Java 高级开发工程师。
相信很多程序员都希望自己能够找到一些宝典,通过修炼 “打开任督二脉”,从此快速进阶成为高手。《Java 开发手册》1(以下简称《手册》)就是诸多宝典之一,它几乎是每个 Java 工程师人手必备的一本参考指南。该手册包括 编程规约、异常日志、单元测试、安全规约、MySQL 数据库、工程结构、设计规约 7 个部分 ,涵盖了 Java 开发的常见知识点。认真实践该《手册》能够帮助 Java 开发者养成好的编程习惯,帮助企业的开发团队在 Java 开发上更加高效、提高容错性、团队协作更好,并有助于提高代码的质量、降低项目维护的难度。然而很多人会遇到看过就忘,记住却不理解、不会用的困境。
另外在实际的学习和工作中,你是否遇到过如下尴尬:

  1. 看《手册》等 Java 技术图书时觉得啥都懂,实战时就忘了;
  2. 很多知识点,知其然而不知其所以然,面试时多问你几个为什么就 “靓仔语塞”;
  3. 想通过读源码来进阶,但是容易迷失在细节中,总是半途而废;
  4. 不重视需求分析,导致开发完成才意识到设计和需求有偏差;
  5. 遇到问题时如果无法简单地定位原因,会优先通过百度、请教别人来解决问题;
  6. 开发中遇到问题排查耗时很久,方法很原始;
  7. 自己开发的项目,每次上线几乎必出 BUG,而有些同事的项目质量则很高,自己却不知道如何才能尽可能地避免。


结合自己学习和工作这么长时间的思考,将出现上述尴尬的原因归结为以下几个原因:

  1. 知道很容易,懂很难,很多人把知道当做懂。自认为掌握了就不愿意再深入学习,恰恰错过了彻底掌握该知识的最佳机会;
  2. 专业基础不够扎实。 很多人急于求成,只重视解决眼前问题,不能够未雨绸缪,巩固好专业基础,最终导致很多问题” 知其然而不知其所以然 “,排查问题时靠猜、靠问,而不是靠扎实的专业基础之上的推测和验证;
  3. 很多人不愿意改变学习方法,学习和培养好的编程习惯,不敢走出舒适区。比如很多人学了很多技术,却从来没有认真仔细阅读过官方文档;比如读源码毫无章法,随心所欲,常常半途而废;
  4. 态度决定一切。很多人嘴上说想学好,但是对自己代码要求很低,总是为自己找各种理由不去学更好的方法,不去努力写更优雅的代码;
  5. 在学习技术过程中,很多人把脑力劳动当成了体力劳动把需要思考的问题当做了纯记忆的问题,学习和工作过程中缺乏思考。比如很多人是 “记忆” 经典图书的知识点,而不是理解知识点,导致容易遗忘,不能灵活运用。在学习很多知识点时缺乏思考,没有去搞懂是什么、不明白为什么、不知道如何去做;
  6. 没有养成好的解决问题的习惯,排查问题靠猜,而不是思考和验证。也没有主动掌握常见的排查问题的步骤和工具等。


很多人缺乏的不只是好的资料,而是学习的方法。学一样的技术,使用不同的方法,最终学习的效果截然不同。而技术是学不完的,如果没有科学的方法,无法很好地应对层出不穷的新技术。每个人的成长速度是不同的,有的人工作多年,却只有一年的技术经验;而有的人工作一年,却有超越一年的技术经验。造成这种差异的主要原因在于学习能力从 Java 新手到高手的进阶过程是一个漫长的爬坑过程。 很多同学遇到 BUG 时由于基础不扎实也没有系统地排查方法,为了解决一个小问题浪费了大把的时间。而且写出的 BUG 太多将直接或间接影响绩效,影响同事、领导对你的印象。阻碍初学者进步的往往是一叶障目不见泰山的盲目自信,往往是一成不变学习方法。破解上述尴尬的核心在于提高学习和排错能力
为了解决上面提出诸多尴尬,本专栏的具体应对策略如下:

  1. 从学习方法主要切入点,结合源码,Java 语言规范 2 和 Java 虚拟机规范 3 等对《手册》的讲解和补充;
  2. 设计者角度思考问题,很多知识点将从设计者视角去思考分析问题,更容易理解问题的根源;
  3. 通过对开发中常用的思维导图、流程图和常见 UML 图的讲解,让大家可以 “大战需求分析”,前期明确需求,后期少返工;
  4. 通过单元测试、Code Review 等相关知识的学习和运用,促进代码质量的提升
  5. 通过独特的学习源码视角,来从正确的角度和方法来学习源码的精髓,反向促进日常的开发;
  6. 结合实际的开发经验,给出相关知识点掌握不牢容易造成的坑,给出一些避坑建议。


本专栏大多数章节的结构设计如下:

  1. 逻辑特色:采用 2w1h 分析方法,即是什么(what),为什么(why)和如何去做(how)的角度来学习知识;
  2. 问题驱动:采用 "5w 思考法",即不断的追问逐渐思考问题的本质,从而实现知识理解的更加深入;
  3. 方法驱动:每节将使用一些学习和解决问题的方法,让大家可以掌握学习的章法;
  4. 对比和类比分析:大多数章节会对知识点和类似的知识点进行对比或类比,从而找出知识之间的联系和差异,加深对知识的理解;
  5. 坑点解读:讲解知识理解不到位可能造成的坑点,分析趟坑原因并给出避坑建议。


注:本专栏所涉及的 Java 源码均默认为 JDK 8 版本(特殊标注除外)。技术是学不完的,学习能力和态度才是进阶的关键。作为一个技术人员,只有保持 “Stay Hungry, Stay Foolish” 的心态,才能够保持进取心;只有真正知道哪些才是更有价值的东西,才能真正少走弯路。
希望大家能够通本专栏的学习,改变学习技术的思维意识,从 “学习具体内容” 为主,转变到学习 “学习的方法” 为主从技术的学习者变为技术的思考者。希望本专栏可以帮助到更多朋友加速技术成长的步伐,做一个更加专业和优秀的 Java 工程师。
参考资料


  1. 阿里巴巴与 Java 社区开发者.《 Java 开发手册 1.5.0》华山版. 2019 ↩︎
  2. James Gosling, Bill Joy, Guy Steele, Gilad Bracha, Alex Buckley.《Java Language Specification: Java SE 8 Edition》. 2015 ↩︎
  3. 《The Java Virtual Machine Specification Java SE 8 Edition》 ↩︎

02 Integer缓存问题分析

505a39d4634fc3e68121cf47776534d2.png

我要扼住命运的咽喉,它妄想使我屈服,这绝对办不到。生活是这样美好,活他一千辈子吧!——贝多芬

1. 前言
《手册》第 7 页有一段关于包装对象之间值的比较问题的规约 1:
【强制】所有整型包装类对象之间值的比较,全部使用 equals 方法比较。
说明:对于 Integer var = ? 在 - 128 至 127 范围内的赋值,Integer 对象是在 IntegerCache.cache 产 生,会复用已有对象,这个区间内的 Integer 值可以直接使用 == 进行判断,但是这个区间之外的所有数据,都会在堆上产生,并不会复用已有对象,这是一个大坑,推荐使用 equals 方法进行判断。
这条建议非常值得大家关注, 而且该问题在 Java 面试中十分常见。
我们还需要思考以下几个问题:

  • 如果不看《手册》,我们如何知道 Integer var = ? 会缓存 -128 到 127 之间的赋值?
  • 为什么会缓存这个范围的赋值?
  • 我们如何学习和分析类似的问题?


2.Integer 缓存问题分析
我们先看下面的示例代码,并思考该段代码的输出结果:

public class IntTest {
	public static void main(String[] args) {
	    Integer a = 100, b = 100, c = 150, d = 150;
	    System.out.println(a == b);
	    System.out.println(c == d);
	}
}


通过运行代码可以得到答案,程序输出的结果分别为: true , false

那么为什么答案是这样?


结合《手册》的描述很多人可能会颇有自信地回答:因为缓存了 -128 到 127 之间的数值,就没有然后了。
那么为什么会缓存这一段区间的数值?缓存的区间可以修改吗?其它的包装类型有没有类似缓存?

what? 咋还有这么多问题?这谁知道啊


莫急,且看下面的分析。


2.1 源码分析法
首先我们可以通过源码对该问题进行分析。
我们知道,Integer var = ? 形式声明变量,会通过 java.lang.Integer#valueOf(int) 来构造 Integer 对象。
很多人可能会说:“你咋能知道这个呢”?
如果不信大家可以打断点,运行程序后会调到这里,总该信了吧?(后面还会再作解释)。
我们先看该函数源码:

/**
 * Returns an {@code Integer} instance representing the specified
 * {@code int} value.  If a new {@code Integer} instance is not
 * required, this method should generally be used in preference to
 * the constructor {@link #Integer(int)}, as this method is likely
 * to yield significantly better space and time performance by
 * caching frequently requested values.
 *
 * This method will always cache values in the range -128 to 127,
 * inclusive, and may cache other values outside of this range.
 *
 * @param  i an {@code int} value.
 * @return an {@code Integer} instance representing {@code i}.
 * @since  1.5
 */
public static Integer valueOf(int i) {
    if (i >= IntegerCache.low && i <= IntegerCache.high)
        return IntegerCache.cache[i + (-IntegerCache.low)];
    return new Integer(i);
}


通过源码可以看出,如果用 Ineger.valueOf(int) 来创建整数对象,参数大于等于整数缓存的最小值( IntegerCache.low )并小于等于整数缓存的最大值( IntegerCache.high), 会直接从缓存数组 (java.lang.Integer.IntegerCache#cache) 中提取整数对象;否则会 new 一个整数对象。那么这里的缓存最大和最小值分别是多少呢?
从上述注释中我们可以看出,最小值是 -128, 最大值是 127。那么为什么会缓存这一段区间的整数对象呢?
通过注释我们可以得知:如果不要求必须新建一个整型对象,缓存最常用的值(提前构造缓存范围内的整型对象),会更省空间,速度也更快。
这给我们一个非常重要的启发:
如果想减少内存占用,提高程序运行的效率,可以将常用的对象提前缓存起来,需要时直接从缓存中提取。
那么我们再思考下一个问题: Integer 缓存的区间可以修改吗?
通过上述源码和注释我们还无法回答这个问题,接下来,我们继续看 java.lang.Integer.IntegerCache 的源码:

/**
 * Cache to support the object identity semantics of autoboxing for values between
 * -128 and 127 (inclusive) as required by JLS.
 *
 * The cache is initialized on first usage.  The size of the cache
 * may be controlled by the {@code -XX:AutoBoxCacheMax=<size>} option.
 * During VM initialization, java.lang.Integer.IntegerCache.high property
 * may be set and saved in the private system properties in the
 * sun.misc.VM class.
 */

private static class IntegerCache {
    static final int low = -128;
    static final int high;
    static final Integer cache[];
    static {
            // high value may be configured by property
            int h = 127;
            String integerCacheHighPropValue =
                sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
           // 省略其它代码
    }
      // 省略其它代码
}


通过 IntegerCache 代码和注释我们可以看到,最小值是固定值 -128, 最大值并不是固定值,缓存的最大值是可以通过虚拟机参数 -XX:AutoBoxCacheMax=<size>}-Djava.lang.Integer.IntegerCache.high=<value> 来设置的,未指定则为 127。
因此可以通过修改这两个参数其中之一,让缓存的最大值大于等于 150。
如果作出这种修改,示例的输出结果便会是: true,true

学到这里是不是发现,对此问题的理解和最初的想法有些不同呢?


这段注释也解答了为什么要缓存这个范围的数据:

是为了自动装箱时可以复用这些对象 ,这也是 JLS2 的要求。
我们可以参考 JLS 的 Boxing Conversion 部分的相关描述。
If the valuepbeing boxed is an integer literal of type intbetween -128and 127inclusive (§3.10.1), or the boolean literal trueorfalse(§3.10.3), or a character literal between 'u0000'and 'u007f'inclusive (§3.10.4), then let aand bbe the results of any two boxing conversions of p. It is always the case that a==b.
在 -128 到 127 (含)之间的 int 类型的值,或者 boolean 类型的 true 或 false, 以及范围在’u0000’和’u007f’ (含)之间的 char 类型的数值 p, 自动包装成 a 和 b 两个对象时, 可以使用 a == b 判断 a 和 b 的值是否相等。
2.2 反汇编法
那么究竟 Integer var = ? 形式声明变量,是不是通过 java.lang.Integer#valueOf(int) 来构造 Integer 对象呢? 总不能都是猜测 N 个可能的函数,然后断点调试吧?如果遇到其它类似的问题,没人告诉我底层调用了哪个方法,该怎么办? 囧…
这类问题有个杀手锏,可以通过对编译后的 class 文件进行反汇编来查看。
首先编译源代码:javac IntTest.java
然后需要对代码进行反汇编,执行:javap -c IntTest
如果想了解 javap 的用法,直接输入 javap -help 查看用法提示(很多命令行工具都支持 -help--help 给出用法提示)。

3f7af0030e527ed06b92033880fd4d71.png


反编译后,我们得到以下代码:

Compiled from "IntTest.java"
public class com.chujianyun.common.int_test.IntTest {
  public com.chujianyun.common.int_test.IntTest();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: bipush        100
       2: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
       5: astore_1
       6: bipush        100
       8: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      11: astore_2
      12: sipush        150
      15: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      18: astore_3
      19: sipush        150
      22: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      25: astore        4
      27: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
      30: aload_1
      31: aload_2
      32: if_acmpne     39
      35: iconst_1
      36: goto          40
      39: iconst_0
      40: invokevirtual #4                  // Method java/io/PrintStream.println:(Z)V
      43: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
      46: aload_3
      47: aload         4
      49: if_acmpne     56
      52: iconst_1
      53: goto          57
      56: iconst_0
      57: invokevirtual #4                  // Method java/io/PrintStream.println:(Z)V
      60: return
}


可以明确得 "看到" 这四个 ``Integer var = ? 形式声明的变量的确是通过 java.lang.Integer#valueOf(int) 来构造 Integer` 对象的。


接下来对汇编后的代码进行详细分析,如果看不懂可略过


根据《Java Virtual Machine Specification : Java SE 8 Edition》3,后缩写为 JVMS , 第 6 章 虚拟机指令集的相关描述以及《深入理解 Java 虚拟机》4 414-149 页的 附录 B “虚拟机字节码指令表”。 我们对上述指令进行解读:


偏移为 0 的指令为:bipush 100 ,其含义是将单字节整型常量 100 推入操作数栈的栈顶;
偏移为 2 的指令为:invokestatic #2 // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer; 表示调用一个 static 函数,即 java.lang.Integer#valueOf(int)


偏移为 5 的指令为:astore_1 ,其含义是从操作数栈中弹出对象引用,然后将其存到第 1 个局部变量 Slot 中;
偏移 6 到 25 的指令和上面类似;
偏移为 30 的指令为 aload_1 ,其含义是从第 1 个局部变量 Slot 取出对象引用(即 a),并将其压入栈;
偏移为 31 的指令为 aload_2 ,其含义是从第 2 个局部变量 Slot 取出对象引用(即 b),并将其压入栈;
偏移为 32 的指令为 if_acmpn,该指令为条件跳转指令,if_ 后以 a 开头表示对象的引用比较。
由于该指令有以下特性:

  • if_acmpeq 比较栈两个引用类型数值,相等则跳转
  • if_acmpne 比较栈两个引用类型数值,不相等则跳转


由于 Integer 的缓存问题,所以 a 和 b 引用指向同一个地址,因此此条件不成立(成立则跳转到偏移为 39 的指令处),执行偏移为 35 的指令。


偏移为 35 的指令: iconst_1,其含义为将常量 1 压栈( Java 虚拟机中 boolean 类型的运算类型为 int ,其中 true 用 1 表示,详见 2.11.1 数据类型和 Java 虚拟机。


然后执行偏移为 36 的 goto 指令,跳转到偏移为 40 的指令。


偏移为 40 的指令:invokevirtual #4 // Method java/io/PrintStream.println:(Z)V
可知参数描述符为 Z ,返回值描述符为 V


根据 4.3.2 字段描述符 ,可知 FieldType 的字符为 Z 表示 boolean 类型, 值为 truefalse
根据 4.3.3 字段描述符 ,可知返回值为 void
因此可以知,最终调用了 java.io.PrintStream#println(boolean) 函数打印栈顶常量即 true
然后比较执行偏移 43 到 57 之间的指令,比较 c 和 d, 打印 false
执行偏移为 60 的指令,即 retrun ,程序结束。


可能有些朋友会对反汇编的代码有些抵触和恐惧,这都是非常正常的现象。


我们分析和研究问题的时候,看懂核心逻辑即可,不要纠结于细节,而失去了重点。


一回生两回熟,随着遇到的例子越来越多,遇到类似的问题时,会喜欢上 javap 来分析和解决问题。


如果想深入学习 java 反汇编,强烈建议结合官方的 JVMS 或其中文版:《Java 虚拟机规范》这本书进行拓展学习。



如果大家不喜欢命令行的方式进行 Java 的反汇编,这里推荐一个简单易用的可视化工具:classpy ,大家可以自行了解学习。

9985c21c430996012619397e3fa05abd.png


3.Long 的缓存问题分析
我们学习的目的之一就是要学会举一反三。因此我们对 Long 也进行类似的研究,探究两者之间有何异同。

3.1 源码分析
类似的,我们接下来分析 java.lang.Long#valueOf(long) 的源码:

/**
 * Returns a {@code Long} instance representing the specified
 * {@code long} value.
 * If a new {@code Long} instance is not required, this method
 * should generally be used in preference to the constructor
 * {@link #Long(long)}, as this method is likely to yield
 * significantly better space and time performance by caching
 * frequently requested values.
 *
 * Note that unlike the {@linkplain Integer#valueOf(int)
 * corresponding method} in the {@code Integer} class, this method
 * is <em>not</em> required to cache values within a particular
 * range.
 *
 * @param  l a long value.
 * @return a {@code Long} instance representing {@code l}.
 * @since  1.5
 */
public static Long valueOf(long l) {
    final int offset = 128;
    if (l >= -128 && l <= 127) { // will cache
        return LongCache.cache[(int)l + offset];
    }
    return new Long(l);
}

发现该函数的写法和 Ineger.valueOf(int) 非常相似。
我们同样也看到, Long 也用到了缓存。 使用 java.lang.Long#valueOf(long) 构造 Long 对象时,值在 [-128, 127] 之间的 Long 对象直接从缓存对象数组中提取。
而且注释同样也提到了:缓存的目的是为了提高性能
但是通过注释我们发现这么一段提示:
Note that unlike the {@linkplain Integer#valueOf(int) corresponding method} in the {@code Integer} class, this method is not required to cache values within a particular range.
注意:和 Ineger.valueOf(int) 不同的是,此方法并没有被要求缓存特定范围的值。
这也正是上面源码中缓存范围判断的注释为何用 // will cache 的原因(可以对比一下上面 Integer 的缓存的注释)。
因此我们可知,虽然此处采用了缓存,但应该不是 JLS 的要求。

那么 Long 类型的缓存是如何构造的呢?
我们查看缓存数组的构造:

private static class LongCache {
    private LongCache(){}

    static final Long cache[] = new Long[-(-128) + 127 + 1];

    static {
        for(int i = 0; i < cache.length; i++)
            cache[i] = new Long(i - 128);
    }
}

可以看到,它是在静态代码块中填充缓存数组的。


3.2 反编译
同样地我们也编写一个示例片段:

public class LongTest {

    public static void main(String[] args) {
        Long a = -128L, b = -128L, c = 150L, d = 150L;
        System.out.println(a == b);
        System.out.println(c == d);
    }
}

编译源代码: javac LongTest.java
对编译后的类文件进行反汇编: javap -c LongTest

得到下面反编译的代码:

public class com.imooc.basic.learn_int.LongTest {
  public com.imooc.basic.learn_int.LongTest();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: ldc2_w        #2                  // long -128l
       3: invokestatic  #4                  // Method java/lang/Long.valueOf:(J)Ljava/lang/Long;
       6: astore_1
       7: ldc2_w        #2                  // long -128l
      10: invokestatic  #4                  // Method java/lang/Long.valueOf:(J)Ljava/lang/Long;
      13: astore_2
      14: ldc2_w        #5                  // long 150l
      17: invokestatic  #4                  // Method java/lang/Long.valueOf:(J)Ljava/lang/Long;
      20: astore_3
      21: ldc2_w        #5                  // long 150l
      24: invokestatic  #4                  // Method java/lang/Long.valueOf:(J)Ljava/lang/Long;
      27: astore        4
      29: getstatic     #7                  // Field java/lang/System.out:Ljava/io/PrintStream;
      32: aload_1
      33: aload_2
      34: if_acmpne     41
      37: iconst_1
      38: goto          42
      41: iconst_0
      42: invokevirtual #8                  // Method java/io/PrintStream.println:(Z)V
      45: getstatic     #7                  // Field java/lang/System.out:Ljava/io/PrintStream;
      48: aload_3
      49: aload         4
      51: if_acmpne     58
      54: iconst_1
      55: goto          59
      58: iconst_0
      59: invokevirtual #8                  // Method java/io/PrintStream.println:(Z)V
      62: return
}


我们从上述代码中发现 Long var = ? 的确是通过java.lang.Long#valueOf(long) 来构造对象的。


3. 总结


本小节通过源码分析法、阅读 JLS 和 JVMS、使用反汇编法,对 IntegerLong 缓存的目的和实现方式问题进行了深入分析。


让大家能够通过更丰富的手段来学习知识和分析问题,通过对缓存目的的思考来学到更通用和本质的东西。


本节使用的几种手段将是我们未来常用的方法,也是工作进阶的必备技能和一个程序员专业程度的体现,希望大家未来能够多动手实践。


下一节我们将介绍 Java 序列化相关问题,包括序列化的定义,序列化常见的方案,序列化的坑点等。


4. 课后题

第 1 题:请大家根据今天的研究分析过程,对下面的一个示例代码进行分析。

public class CharacterTest {
    public static void main(String[] args) {
        Character a = 126, b = 126, c = 128, d = 128;
        System.out.println(a == b);
        System.out.println(c == d);
    }
}

第 2 题: 结合今天的讲解,请自行对 CharacterShortBoolean 的缓存问题进行分析,并比较它们的异同。
参考资料


  1. 阿里巴巴与 Java 社区开发者.《 Java 开发手册 1.5.0》华山版. 2019. 7 ↩︎
  2. James Gosling, Bill Joy, Guy Steele, Gilad Bracha, Alex Buckley.《Java Language Specification: Java SE 8 Edition》. 2015 ↩︎
  3. Tim Lindholm, Frank Yellin, Gilad Bracha, Alex Buckley. 《Java Virtual Machine Specification : Java SE 8 Edition》. 2015 ↩︎
  4. 周志明.《深入理解 Java 虚拟机》. 机械工业出版社. 2018 ↩︎
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值