jdk源码阅读第一天

最新推荐文章于 2022-10-17 11:45:53 发布

101之歌

最新推荐文章于 2022-10-17 11:45:53 发布

阅读量608

点赞数

分类专栏： java

本文链接：https://blog.csdn.net/qxf1374268/article/details/79325242

版权

java 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

jdk源码的位置在jdk的src.zip压缩包下面，只需要解压之后就可以导入开始阅读
这篇学习笔记引用了下面文章的很多内容，在此声明一下：
https://zq99299.gitbooks.io/java-tutorial/content/content/lang/string.html

jdk源码项目架构

String类

String类位于java.lang.String包下面。

package java.lang;

import java.io.ObjectStreamField;
import java.io.UnsupportedEncodingException;
import java.nio.charset.Charset;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.Formatter;
import java.util.Locale;
import java.util.Objects;
import java.util.StringJoiner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;

String类的开始引入的类

public final class String
    //继承了三个父类接口：Serializable,Comparable,CharSequence
    implements java.io.Serializable, Comparable<String>, CharSequence {

    private final char value[];


    private int hash; // Default to 0


    private static final long serialVersionUID = -6849794470754667710L;

String类的类修饰词是final，意味着String类不能被继承，所以我们只能调用String类
String类的上层接口有三个，分别是Serializable，Comparable，CharSequence
首先，是Serializable接口，我去看了下源码，发现只是定义了一个接口：

package java.io;

public interface Serializable {
}

而且，这个Serializable接口在我想修改的时候提示我：file is read only，说明java中定义的接口都是只读的，不允许修改
我们知道，Serializable在java中是属于java.io.Serializable的，类通过实现Serializable接口以启用其序列化功能，未实现此接口的类将无法使其任何状态序列化和反序列化，可序列化类的所有子类型本身都是可序列化的，序列化接口没有方法或者字段，仅用于标识可序列化的语义。
然后我们来看Comparable

package java.lang;
import java.util.*;

public interface Comparable<T> {
  public int compareTo(T o);
}

此接口强行对实现它的每个类的对象进行整体排序。这种排序被称为类的自然排序，类的 compareTo 方法被称为它的自然比较方法。
当我想点击compareTo方法时，发现好多类都重写了这个方法
然后，我们接下来看CharSequence接口

package java.lang;

import java.util.NoSuchElementException;
import java.util.PrimitiveIterator;
import java.util.Spliterator;
import java.util.Spliterators;
import java.util.function.IntConsumer;
import java.util.stream.IntStream;
import java.util.stream.StreamSupport;


public interface CharSequence {
    int length();
    char charAt(int index);
    CharSequence subSequence(int start, int end);
    public String toString();
    public default IntStream chars() {
        class CharIterator implements PrimitiveIterator.OfInt {
            int cur = 0;

            public boolean hasNext() {
                return cur < length();
            }

            public int nextInt() {
                if (hasNext()) {
                    return charAt(cur++);
                } else {
                    throw new NoSuchElementException();
                }
            }

            @Override
            public void forEachRemaining(IntConsumer block) {
                for (; cur < length(); cur++) {
                    block.accept(charAt(cur));
                }
            }
        }

        return StreamSupport.intStream(() ->
                Spliterators.spliterator(
                        new CharIterator(),
                        length(),
                        Spliterator.ORDERED),
                Spliterator.SUBSIZED | Spliterator.SIZED | Spliterator.ORDERED,
                false);
    }
    public default IntStream codePoints() {
        class CodePointIterator implements PrimitiveIterator.OfInt {
            int cur = 0;

            @Override
            public void forEachRemaining(IntConsumer block) {
                final int length = length();
                int i = cur;
                try {
                    while (i < length) {
                        char c1 = charAt(i++);
                        if (!Character.isHighSurrogate(c1) || i >= length) {
                            block.accept(c1);
                        } else {
                            char c2 = charAt(i);
                            if (Character.isLowSurrogate(c2)) {
                                i++;
                                block.accept(Character.toCodePoint(c1, c2));
                            } else {
                                block.accept(c1);
                            }
                        }
                    }
                } finally {
                    cur = i;
                }
            }

            public boolean hasNext() {
                return cur < length();
            }

            public int nextInt() {
                final int length = length();

                if (cur >= length) {
                    throw new NoSuchElementException();
                }
                char c1 = charAt(cur++);
                if (Character.isHighSurrogate(c1) && cur < length) {
                    char c2 = charAt(cur);
                    if (Character.isLowSurrogate(c2)) {
                        cur++;
                        return Character.toCodePoint(c1, c2);
                    }
                }
                return c1;
            }
        }

        return StreamSupport.intStream(() ->
                Spliterators.spliteratorUnknownSize(
                        new CodePointIterator(),
                        Spliterator.ORDERED),
                Spliterator.ORDERED,
                false);
    }
}

CharSequence 是 char 值的一个可读序列。此接口对许多不同种类的 char 序列提供统一的只读访问。char 值表示 Basic Multilingual Plane (BMP) 或代理项中的一个字符。有关详细信息，请参阅 Unicode 字符表示形式。
这个类我是看不太懂，需要以后加以补充
还有一个serialVersionUID，这个变量我百度了一下，发现是这么解释的：

serialVersionUID适用于Java的序列化机制。简单来说，Java的序列化机制是通过判断类的serialVersionUID来验证版本一致性的。在进行反序列化时，JVM会把传来的字节流中的serialVersionUID与本地相应实体类的serialVersionUID进行比较，如果相同就认为是一致的，可以进行反序列化，否则就会出现序列化版本不一致的异常，即是InvalidCastException。

所以说，当一个类需要序列化和反序列化的时候，是不是就需要添加这个serialVersionUID了？有待我以后的补充

测试类1

    String hello = new String("你好，hello");
    System.out.println(hello.charAt(1));
    hello.compareTo("你");
    hello.compareToIgnoreCase("你好，hello");

charAt方法时String类中的一个方法，它的作用是拿取String字符串的下标值，源码如下：

//最开始定义的是一个char数组，应该是将String放到char数组里面
private final char value[];
//定义一个整型变量hash，是String的hashCode，默认是0
private int hash;

//这个是String的无参构造方法
public String() {
    this.value = "".value;
  }

//这个是String的有参构造方法，获取传入的String字符串，然后将传入值的值给value数组，将传入值的hashCode给当前的hash值
public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
  }

public char charAt(int index) {
        //如果我们取的下标值小于0或者大于char数组的长度，就报字符串下标越界异常
        if ((index < 0) || (index >= value.length)) {
            throw new StringIndexOutOfBoundsException(index);
        }
        //否则的话，返回下标的值
        return value[index];
    }

compareTo方法也是String类中的一个方法，是按字典顺比较两个字符串，那是什么字典顺序呢？先来看看Unicode字符串表示形式

char 数据类型（和 Character 对象封装的值）基于原始的 Unicode 规范，将字符定义为固定宽度的 16 位实体。 char 值表示 Basic Multilingual Plane (BMP) 代码点，其中包括代理项代码点，或 UTF-16 编码的代码单元。int 值表示所有 Unicode 代码点，包括增补代码点。
反正以上的我是没看太懂
也就是说一个char类型对应一个整数。这个整数的大小就是字典顺序
下面是compareTo的源码：

    //最开始定义的是一个char数组，应该是将String放到char数组里面
    private final char value[];

    public int compareTo(String anotherString) {
        //首先，定义一个整型变量len1,用于存储value数组的长度
        int len1 = value.length;
        //再定义一个整型变量len2,用于存储传入的值的长度
        int len2 = anotherString.value.length;
        //取两个值中的最小值
        int lim = Math.min(len1, len2);
        //将value值给v1数组
        char v1[] = value;
        //将传入的值给v2数组
        char v2[] = anotherString.value;

        //定义一个中间值k
        int k = 0;
        //当k小于最小的长度时，
        while (k < lim) {
            char c1 = v1[k];
            char c2 = v2[k];
            if (c1 != c2) {
                return c1 - c2;
            }
            k++;
           }
        // 如果短串相等，那么直接返回
        // 如：len1 = abc,len2 = ab
        // 由于短串全部相等，那么这里长度相剪：3-2 = 1， 1串大于二串
        // 如果：len1 = ab,len2 = abc, 2-3=-1, 1串小于二串
        // 如果正好相等，那么返回0；
        return len1 - len2;
    }

反正我现在目前是没有看太懂这个方法。。然后我还有几个疑问，所以我百度了一下，发现有这么几个说法：
http://bbs.csdn.net/topics/390962648
http://www.cnblogs.com/fairly/p/6091456.html
http://ask.csdn.net/questions/647850
下面来看compareToIgnoreCase(String str)这个方法

public int compareToIgnoreCase(String str) {
        return CASE_INSENSITIVE_ORDER.compare(this, str);
  }
  public static final Comparator<String> CASE_INSENSITIVE_ORDER
                                         = new CaseInsensitiveComparator();
    private static class CaseInsensitiveComparator
            implements Comparator<String>, java.io.Serializable {
        // use serialVersionUID from JDK 1.2.2 for interoperability
        private static final long serialVersionUID = 8575799808933029326L;

        public int compare(String s1, String s2) {
            int n1 = s1.length();
            int n2 = s2.length();
            int min = Math.min(n1, n2);
            // 和compareTo一样的套路，对比最小串长度
            for (int i = 0; i < min; i++) {
                char c1 = s1.charAt(i);
                char c2 = s2.charAt(i);
                if (c1 != c2) { // 码点不相等，全部转换成大写
                    c1 = Character.toUpperCase(c1);
                    c2 = Character.toUpperCase(c2);
                    if (c1 != c2) { // 还不相等，就全部转换成小写
                        c1 = Character.toLowerCase(c1);
                        c2 = Character.toLowerCase(c2);
                        if (c1 != c2) { // 还不相等，直接返回了。 对Unicode不熟悉，本人不知道在什么情况下会出现这种情况
                            // No overflow because of numeric promotion
                            return c1 - c2;
                        }
                    }
                }
            }
            return n1 - n2;
        }
    }