问题:
- String-字符串如何存储?
String底层实际上是一个字符数组
private final char value[];//底层代码
- 每个字符是如何存储的?
跟编码表有关系
- ASCII表
- Unicode
- utf-(常用utf-8在国内使用)三个字节来描述一个字符
- gbk-(专门中文字符集)两个字节来描述一个字符
- 等
概念:
编码:将字符,根据指定的字符集来转换成 数值
解码:将数值,根据指定的字符集转化为字符
看看几个String题:
String s1 = "abc";
String s2 = "abc";
System.out.println("s1 == s2: "+(s1==s2));
final String s3 = "abc";
final String s4 = "abc";
System.out.println("s3 == s4: "+(s3==s4));
String s5 ="abc";
String s6 ="abc";
String s7 = (s5+s6).intern();
System.out.println("s7 == (s5+s6)): "+(s7 == (s5+s6)));
String s8 = "abcabc";
System.out.println("s8==(s1+s2):"+(s8==(s1+s2)));
System.out.println("s8==(s3+s4):"+(s8==(s3+s4)));
System.out.println("s8==s7:"+(s8==s7));
运行结果:
s1 == s2: true
s3 == s4: true
s7 == (s5+s6)): false
s8==(s1+s2):false
s8==(s3+s4):true
s8==s7:true
下面这段代码创建了几个对象?
String s = new String("abc");
答案:创建了两个对象,一个在常量池,一个在堆内存
判断定义为String类型的s1和s2是否相对
String s1 = new String("abc");
String s2 = "abc";
System.out.println("s1 == s2: "+(s1==s2));
System.out.println("s1.equals(s2): "+(s1.equals(s2)));
答案:
s1 == s2: false
s1.equals(s2): true
常用的构造方法
- public String():空构造
String str = new String();
- public String(byte bytes[]) :把字节数组转换成字符串
byte [] bytes = {97,98,99,100};
String str = new String(bytes);
- public String(byte bytes[], int offset, int length):把字节数组的一部分转换成字符串
byte [] bytes = {97,98,99,100};
String str = new String(bytes,1,3);
- public String(char value[]):把字符数组转换成字符串
char [] c = {'a','b','c','d','e','f'};
String str = new String(c);
- public String(char value[], int offset, int count):把字符数组的一部分转换成字符串
char [] c = {'a','b','c','d','e','f'};
String str = new String(c,1,4);
- public String(String original):把字符串常量值转换成字符串
String str = new String("abcdefg");
indexOf()和lastIndexOf()
indexOf
取给定字符在字符串中第一次出现的位置的位置
String email = "123456789@xxx.com";
//第一次出现的位置
System.out.println(email.indexOf('@'));
lastIndexOf
//取给定字符在字符串中最后一次出现的位置
String email = "123456789@xxx.com";
//取给定字符在字符串中最后一次出现的位置
System.out.println(email.lastIndexOf('@'));
indexO
f和lastIndexOf
还可以针对字符串来求第一次(最后一次)出现下标
//indexOf和lastIndexOf还可以针对字符串来求第一次(最后一次)出现下标
System.out.println(email.indexOf("xxx"));
toCharArray()
把字符串中的每个字符放到字符数组中
String email = "123456789@xxx.com";
char[] charArray = email.toCharArray();
System.out.println(Arrays.toString(charArray));
运行结果
[1, 2, 3, 4, 5, 6, 7, 8, 9, @, x, x, x, ., c, o, m]
Arrays.copyOf()和System.arraycopy()
数组的拷贝(两种方式)
int [] numbers = {1,2,3};
int [] arrCopy1 = new int[numbers.length];
System.arraycopy(numbers,0,arrCopy1,0,numbers.length);
System.out.println(Arrays.toString(arrCopy1));
int [] arrCopy2= Arrays.copyOf(numbers, numbers.length);
System.out.println(Arrays.toString(arrCopy2));
substring()
字符串截取(获取子字符串)
String str1 = "123qwertyuiop";
String substring1 = str1.substring(2, 5);
String substring2 = str1.substring(2);
System.out.println("substring1: "+substring1);
System.out.println("substring2: "+substring2);
replace()
替换字符串中的字符
String str2 ="123qwer456zxcv789asdf";
String replace = str2.replace("123", "");
String replace1 = str2.replace('1', 'a');
System.out.println("replace:"+replace);
System.out.println("replace1:"+replace1);
根根据正表达式来替换字符串中匹配的内容
//根根据正表达式来替换字符串中匹配的内容
String replaceAll = str2.replaceAll("[0-9]", "");
System.out.println("replaceAll:"+replaceAll);
split()
字符串分割
字符串分割的时候,要注意,如果分隔符在字符串的末尾,可以将这个分隔符忽略掉
字符串分割才用的是正则表达式匹配,并非是给定的字符串
String line = "张三,李四,";
//[1][3-9][0-9]{9} = 1[3-9][0-9]{9}
String[] arr = line.split(",");
System.out.println(Arrays.toString(arr));
String p = "skaldk12831203askldaklkadl2askdl12";
String[] arr2 = p.split("[0-9]+");
System.out.println(Arrays.toString(arr2));
String regex = "[0-9A-Za-z]{8,15}@[a-zA-Z0-9]{2,10}.[a-zA-Z0-9]{2,10}";
boolean matches = "anmasakjaa@xxx.com".matches(regex);//匹配
System.out.println(matches);
trim()
trim可以修剪掉字符串两端的空格*
String blank = " asasd aa aa ";
System.out.println(blank);
//trim可以修剪掉字符串两端的空格
System.out.println(blank.trim());
equalsIgnoreCase()
比较两个字符串的内容是否相等,忽略大小写。
str = "AbC";
boolean b = str.equalsIgnoreCase("aBc");
System.out.println(b);//true
扩展
字符集, 也就是我们通常说的编码格式
StandardCharsets
表示标准字符集
我们中文支持的字符集有UTF-8
、GBK
、GB2312
,但是收录汉字最齐全就是UTF-8
浏览器默认的字符集编码是ISO-8859-1,如果我们要处理浏览器传递过来的数据,需要
对编码进行处理,才能正确的识别数据乱码产生的原因:字符集在传输的时候使用的编码与在解析的时候使用的编码不一致
Charset charset = StandardCharsets.ISO_8859_1;//StandardCharsetss标准字符集。
这里我们的
java
文件的编码格式是UTF-8
,因此我们这里的字符串编码格式就是UTF-8
String str = "中文";
将之前使用
UTF-8
编码格式的字符串重新进行组装,组装的时候采用的编码格式是ISO-8859-1
这个时候我们再来打印这个字符串,发现这个字符串展示出来的就是乱码
String newStr = new String(str.getBytes(), charset);
System.out.println(newStr);