- jdk源码的位置在jdk的
src.zip
压缩包下面,只需要解压之后就可以导入开始阅读 - 这篇学习笔记引用了下面文章的很多内容,在此声明一下:
- https://zq99299.gitbooks.io/java-tutorial/content/content/lang/string.html
String类
- String类位于java.lang.String包下面。
package java.lang;
import java.io.ObjectStreamField;
import java.io.UnsupportedEncodingException;
import java.nio.charset.Charset;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.Formatter;
import java.util.Locale;
import java.util.Objects;
import java.util.StringJoiner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;
- String类的开始引入的类
public final class String
//继承了三个父类接口:Serializable,Comparable,CharSequence
implements java.io.Serializable, Comparable<String>, CharSequence {
private final char value[];
private int hash; // Default to 0
private static final long serialVersionUID = -6849794470754667710L;
- String类的类修饰词是final,意味着String类不能被继承,所以我们只能调用String类
- String类的上层接口有三个,分别是
Serializable
,Comparable
,CharSequence
- 首先,是
Serializable
接口,我去看了下源码,发现只是定义了一个接口:
package java.io;
public interface Serializable {
}
- 而且,这个
Serializable
接口在我想修改的时候提示我:file is read only
,说明java中定义的接口都是只读的,不允许修改 - 我们知道,
Serializable
在java中是属于java.io.Serializable
的,类通过实现Serializable
接口以启用其序列化功能,未实现此接口的类将无法使其任何状态序列化和反序列化,可序列化类的所有子类型本身都是可序列化的,序列化接口没有方法或者字段,仅用于标识可序列化的语义。 - 然后我们来看
Comparable
package java.lang;
import java.util.*;
public interface Comparable<T> {
public int compareTo(T o);
}
- 此接口强行对实现它的每个类的对象进行整体排序。这种排序被称为
类的自然排序
,类的compareTo
方法被称为它的自然比较方法。 - 当我想点击
compareTo
方法时,发现好多类都重写了这个方法 - 然后,我们接下来看
CharSequence
接口
package java.lang;
import java.util.NoSuchElementException;
import java.util.PrimitiveIterator;
import java.util.Spliterator;
import java.util.Spliterators;
import java.util.function.IntConsumer;
import java.util.stream.IntStream;
import java.util.stream.StreamSupport;
public interface CharSequence {
int length();
char charAt(int index);
CharSequence subSequence(int start, int end);
public String toString();
public default IntStream chars() {
class CharIterator implements PrimitiveIterator.OfInt {
int cur = 0;
public boolean hasNext() {
return cur < length();
}
public int nextInt() {
if (hasNext()) {
return charAt(cur++);
} else {
throw new NoSuchElementException();
}
}
@Override
public void forEachRemaining(IntConsumer block) {
for (; cur < length(); cur++) {
block.accept(charAt(cur));
}
}
}
return StreamSupport.intStream(() ->
Spliterators.spliterator(
new CharIterator(),
length(),
Spliterator.ORDERED),
Spliterator.SUBSIZED | Spliterator.SIZED | Spliterator.ORDERED,
false);
}
public default IntStream codePoints() {
class CodePointIterator implements PrimitiveIterator.OfInt {
int cur = 0;
@Override
public void forEachRemaining(IntConsumer block) {
final int length = length();
int i = cur;
try {
while (i < length) {
char c1 = charAt(i++);
if (!Character.isHighSurrogate(c1) || i >= length) {
block.accept(c1);
} else {
char c2 = charAt(i);
if (Character.isLowSurrogate(c2)) {
i++;
block.accept(Character.toCodePoint(c1, c2));
} else {
block.accept(c1);
}
}
}
} finally {
cur = i;
}
}
public boolean hasNext() {
return cur < length();
}
public int nextInt() {
final int length = length();
if (cur >= length) {
throw new NoSuchElementException();
}
char c1 = charAt(cur++);
if (Character.isHighSurrogate(c1) && cur < length) {
char c2 = charAt(cur);
if (Character.isLowSurrogate(c2)) {
cur++;
return Character.toCodePoint(c1, c2);
}
}
return c1;
}
}
return StreamSupport.intStream(() ->
Spliterators.spliteratorUnknownSize(
new CodePointIterator(),
Spliterator.ORDERED),
Spliterator.ORDERED,
false);
}
}
- CharSequence 是 char 值的一个可读序列。此接口对许多不同种类的 char 序列提供统一的只读访问。char 值表示 Basic Multilingual Plane (BMP) 或代理项中的一个字符。有关详细信息,请参阅 Unicode 字符表示形式。
- 这个类我是看不太懂,需要以后加以补充
- 还有一个
serialVersionUID
,这个变量我百度了一下,发现是这么解释的:
serialVersionUID适用于Java的序列化机制。简单来说,Java的序列化机制是通过判断类的serialVersionUID来验证版本一致性的。在进行反序列化时,JVM会把传来的字节流中的serialVersionUID与本地相应实体类的serialVersionUID进行比较,如果相同就认为是一致的,可以进行反序列化,否则就会出现序列化版本不一致的异常,即是InvalidCastException。
所以说,当一个类需要序列化和反序列化的时候,是不是就需要添加这个
serialVersionUID
了?有待我以后的补充测试类1
String hello = new String("你好,hello"); System.out.println(hello.charAt(1)); hello.compareTo("你"); hello.compareToIgnoreCase("你好,hello");
charAt
方法时String类中的一个方法,它的作用是拿取String字符串的下标值,源码如下:
//最开始定义的是一个char数组,应该是将String放到char数组里面
private final char value[];
//定义一个整型变量hash,是String的hashCode,默认是0
private int hash;
//这个是String的无参构造方法
public String() {
this.value = "".value;
}
//这个是String的有参构造方法,获取传入的String字符串,然后将传入值的值给value数组,将传入值的hashCode给当前的hash值
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
public char charAt(int index) {
//如果我们取的下标值小于0或者大于char数组的长度,就报字符串下标越界异常
if ((index < 0) || (index >= value.length)) {
throw new StringIndexOutOfBoundsException(index);
}
//否则的话,返回下标的值
return value[index];
}
compareTo
方法也是String类中的一个方法,是按字典顺比较两个字符串,那是什么字典顺序呢?先来看看Unicode字符串表示形式char 数据类型(和 Character 对象封装的值)基于原始的 Unicode 规范,将字符定义为固定宽度的 16 位实体。 char 值表示 Basic Multilingual Plane (BMP) 代码点,其中包括代理项代码点,或 UTF-16 编码的代码单元。int 值表示所有 Unicode 代码点,包括增补代码点。
反正以上的我是没看太懂
- 也就是说一个char类型对应一个整数。这个整数的大小就是字典顺序
- 下面是
compareTo
的源码:
//最开始定义的是一个char数组,应该是将String放到char数组里面
private final char value[];
public int compareTo(String anotherString) {
//首先,定义一个整型变量len1,用于存储value数组的长度
int len1 = value.length;
//再定义一个整型变量len2,用于存储传入的值的长度
int len2 = anotherString.value.length;
//取两个值中的最小值
int lim = Math.min(len1, len2);
//将value值给v1数组
char v1[] = value;
//将传入的值给v2数组
char v2[] = anotherString.value;
//定义一个中间值k
int k = 0;
//当k小于最小的长度时,
while (k < lim) {
char c1 = v1[k];
char c2 = v2[k];
if (c1 != c2) {
return c1 - c2;
}
k++;
}
// 如果短串相等,那么直接返回
// 如:len1 = abc,len2 = ab
// 由于短串全部相等,那么这里长度相剪:3-2 = 1, 1串大于二串
// 如果:len1 = ab,len2 = abc, 2-3=-1, 1串小于二串
// 如果正好相等,那么返回0;
return len1 - len2;
}
- 反正我现在目前是没有看太懂这个方法。。然后我还有几个疑问,所以我百度了一下,发现有这么几个说法:
- http://bbs.csdn.net/topics/390962648
- http://www.cnblogs.com/fairly/p/6091456.html
下面来看
compareToIgnoreCase(String str)
这个方法
public int compareToIgnoreCase(String str) {
return CASE_INSENSITIVE_ORDER.compare(this, str);
}
public static final Comparator<String> CASE_INSENSITIVE_ORDER
= new CaseInsensitiveComparator();
private static class CaseInsensitiveComparator
implements Comparator<String>, java.io.Serializable {
// use serialVersionUID from JDK 1.2.2 for interoperability
private static final long serialVersionUID = 8575799808933029326L;
public int compare(String s1, String s2) {
int n1 = s1.length();
int n2 = s2.length();
int min = Math.min(n1, n2);
// 和compareTo一样的套路,对比最小串长度
for (int i = 0; i < min; i++) {
char c1 = s1.charAt(i);
char c2 = s2.charAt(i);
if (c1 != c2) { // 码点不相等,全部转换成大写
c1 = Character.toUpperCase(c1);
c2 = Character.toUpperCase(c2);
if (c1 != c2) { // 还不相等,就全部转换成小写
c1 = Character.toLowerCase(c1);
c2 = Character.toLowerCase(c2);
if (c1 != c2) { // 还不相等,直接返回了。 对Unicode不熟悉,本人不知道在什么情况下会出现这种情况
// No overflow because of numeric promotion
return c1 - c2;
}
}
}
}
return n1 - n2;
}
}
读不下去了,先挖个坑放在这儿。。。