字符串是Java程序中经常处理的对象,如果字符串运用的不好,将影响到程序运行的效率。在Java中,字符串作为String类的实例来处理。以对象的方式处理字符串,将字符串更加灵活、方便。了解字符串上可用的操作,可以节省程序编写与维护的时间。
10.1 String类
单个字符可以用char类型保存,多个字符组成的文本就需要保存在String对象中。String通常被称为字符串,一个String对象最多可以保存(2的32次方减1)个字节(占用4GB空间大小)的文本内容。
10.1.1 声明字符串
在Java语言中,字符串必须包含在一对双引号("")之内。例如:
"23.23"、"ABCDE"、"你好"
以上都是字符串常量,字符串常量可以是系统能够显示的任何文字信息,甚至可以是单个字符。
可以通过以下语法格式来声明字符串常量:
String str;
声明字符串变量s,代码如下:
String s;
10.1.2 创建字符串
在Java语言中,将字符串作为对象来处理,因此可以像创建其他类对象一样来创建字符串对象。创建对象要使用类的构造方法。String类的常用构造方法如下。
1.String(char a[])
该方法用一个字符数组a创建String对象,代码如下:
char a[] = {'g','o','o','d'};
String s = new String(a); //等价于:String s = new String("good") ;
2.String(char a[], int offset, int length)
该方法提取字符数组a中的一部分创建一个字符串对象。参数offset表示开始截取字符串的位置,length表示截取字符串的长度。代码如下:
char a[] = {'s','t','u','d','e','n','t'};
String s = new String(a,2,4); //等价于:String s = new String("uden") ;
3.String(char a[] value)
该构造方法可分配一个新的String对象,使其表示字符数组参数中的所有元素连接的结果。代码如下:
char a[] = {'s','t','u','d','e','n','t'};
String s = new String(a); //等价于:String s = new String("student") ;
除通过以上几种使用String类的构造方法来创建字符串变量外,还可以通过将字符串常量的引用赋值给一个字符串变量来创建字符串。代码如下:
String wtr1,str2;
str1 = "We are students"
str2 = "We are students"
此时,str1与str2引用相同的字符串常量,因此具有相同的实体。
10.2 连接多个字符串
对于以声明的字符串,可以对其进行相应的操作,连接字符串就是字符操作中比较简单的一种。可以对多个字符串进行连接,也可以使字符串与其他数据类型进行连接。
10.2.1 连接多个字符串
使用“+”运算符可实现连接多个字符串的功能。“+”运算符可以连接多个String对象并产生一个新的String对象。例题如下:
10.2.2 连接其他数据类型
字符串也可同其他基本数据类型进行连接。如果将字符串同其他数据类型数据进行连接,会将其他数据类型的数据直接转换成字符串。例题如下:
本实例实现的是将字符串常量与整型常量booktime和浮点类变量practice相连后的结果输出。在这里booktime和practice都不是字符串,但它们与字符串相连时会自动调用toString()方法并转换成字符串形式,然后参与字符串连接。
10.3 获取字符串信息
字符串作为对象,可以通过相应方法获取字符串的有效信息,如获取某字符串的长度、某个索引位置的字符串等。以下将讲解几种获取字符串的相关信息的方法。
10.3.1 获取字符串长度
使用String类的length()方法可获取声明的字符串对象的长度。语法如下:
str.length()
其中,str为字符串对象。
获取字符串长度,代码如下:
String str = "We are students" ;
int size = str.length();
上段代码是将字符串str的长度赋值给int型变量size,此时变量size的值为15,这表示length()方法返回的字符串的长度(包括字符串中的空格)。
10.3.2 字符串查找
String类提供了两种查找字符串的方法,即indexOf0与lastlndexOf0方法。这两种方法都允许在字符串中搜索指定条件的字符或字符串。indexOf0方法返回的是搜索的字符或字符串首次出现的位置,lastlndexof0方法返回的是搜索的字符或字符串最后一次出现的位置。
1.indexOf(String s)
该方法用于返回参数字符串s在指定字符串中首次出现的索引位置。当调用String类的indexof0方法时,会从当前字符串的开始位置搜索s的位置。如果没有检索到字符串s,该方法的返回值是-1。语法如下:
str.indexOf(substr)
str:任意字符串对象。
substr: 要搜索的字符串。
查找字符a在字符串str中的索引位置,代码如下:
String str ="We are students";
int size = strindexOf("a");//变量size的值是3
理解字符串的索引位置,要对字符串的下标有所了解。在Java语言中,String对象是用数组表示的。字符串的下标是0~length0-1。
2. lastlndexOf(String str)
该方法用于返回指定字符串最后一次出现的索引位置。当调用String类的lastlndexOf0方法时,会从当前字符串的开始位置检索参数字符串str,并将最后一次出现str的索引位置返回。如果没有检索到字符串str,该方法返回-1。语法如下 :
str.lastlndexOf(substr)
str:任意字符串对象。
substr: 要搜索的字符串。
例题如下:
10.3.3 获取指定索引位置的字符
使用charAt()方法可将指定索引的字符返回。语法如下:
str.charAt(int index)
str:任意字符串。
index:整数型,用于指定要返回字符的下标。
例题如下:
10.4 字符串操作
String类中包含了很多方法,允许程序员对字符串进行操作来满足实际编程中的需要。本节将讲解几种常见的字符串操作。
10.4.1获取子字符串
通过String类的substring0方法可对字符串进行截取。substring0方法被两种不同的重载形式,来满足不同的需要。这些形式的共同点就是都利用字符串的下标进行截取,且应明确字符串下标是从0开始的。
1. substring(int beginlndex)该方法返回的是从指定的索引位置开始截取直到该字符串结尾的子串。语法如下 :
str.substring(int beginlndex)
其中,beginlndex指定从某一索引处开始截取字符串。
截取字符串,代码如下:
String str = "Hello World"; //定义字符串str
String substr = str.substring(3); //获取字符串,此时substr值为lo World
2. substring(intbeginIndex,intendIndex)
该方法返回的是从字符串某一索引位置开始截取至某一索引位置结束的子串。语法如下
substring(int beginlndex,int endlndex)
beginindex:开始截取子字符串的索引位置。
endIndex:子字符串在整个字符串中的结束位置。
例题如下:
10.4.2 去除空格
trim()方法返回字符串的副本,忽略前导空格和尾部空格。语法如下:
str.trim()
其中,str为任意字符串对象。
例题如下:
10.4.3 字符串替换
replace0方法可实现将指定的字符或字符串替换成新的字符或字符串。语法如下:
str.replace(CharSequence target,
CharSequence replacement)
target:要替换的字符或字符串。
replacement:用于替换原来字符串的内容。
replace0方法返回的结果是一个新的字符串。如果字符或字符串oldChar没有出现在该对象表达式中的字符串序列中,则将原字符串返回 。
例题如下:
10.4.4判断字符串的开始与结尾
startsWith0方法与endsWith0方法分别用于判断字符串是否以指定的内容开始或结束。这两个方法的返回值都为boolean类型。
1.startsWith0方法
该方法用于判断当前字符串对象的前缀是否为参数指定的字符串。语法如下:
str.startsWith(String prefix)
其中,prefix是指作为前缀的字符串。
2.endsWith0方法
该方法用于判断当前字符串是否为以给定的子字符串结束。语法如下
str.endsWith(String suffix)
其中,suffix是指作为后缀的字符串。
例题如下:
10.4.5判断字符串是否相等
对字符串对象进行比较不能简单地使用比较运算符“==”,因为比较运算符比较的是两个字符串的地址是否相同。即使两个字符串的内容相同,两个对象的内存地址也是不同的,使用比较运算符仍然会返回false。使用比较运算符比较两个字符串,代码如下:
String tom = new String("I am a
student");
String jerry = new String ("I am a
student");
boolean b = (tom == jerry);
此时,布尔型变量b的值为false,因为字符串是对象,tom、jerry是引用,内存示意图如图10.13所示
因此,要比较两个字符串内容是否相等,应使用equals0方法和equalslgnoreCase0方法
1.equals0方法
如果两个字符串具有相同的字符和长度,则使用equals0方法进行比较时,返回true。否则,返回false。语法如下:
str.equals(String otherstr)
其中,str、otherstr是要比较的两个字符串对象。
2.equalslgnoreCase(方法
使用equals0方法对字符串进行比较时是区分大小写的,而使用equalslgnoreCase0方法是在忽略了大小写的情况下比较两个字符串是否相等,返回结果仍为boolean类型。语法如下:
str.equalslgnoreCase(String otherstr)
其中,str、otherstr是要比较的两个字符串对象。
通过下面的例子可以看出equals0方法和equalslgnoreCase()方法的区别。
例题如下:
10.4.6按字典顺序比较两个字符串
compareTo0方法为按字典顺序比较两个字符串,该比较基于字符串中各个字符的Unicode值,按
字典顺序将String对象表示的字符序列与参数字符串所表示的字符序列进行比较。如果按字典顺序
此String对象位于参数字符串之前,则比较结果为一个负整数;如果按字典顺序此String对象位于参
数字符串之后,则比较结果为一个正整数;如果这两个字符串相等则结果为0。语法如下:
str.compareTo(String otherstr)
其中,str、otherstr是要比较的两个字符串对象。
例题如下:
10.4.7字母大小写转换
String类的toLowerCase0方法可将字符串中的所有大写字母改写为小写字母,而toUpperCase0方
法可将字符串中的所有小写字母改写为大写字母。
1.toLowerCase()方法
该方法将字符串中的所有大写字母转换为小写。如果字符串中没有应该被转换的字符,则将原字符
串返回;否则将返回一个新的字符串,将原字符串中每个大写字母都转换成小写,字符串长度不变。语法如下:
str.toLowerCase()
其中,str是要进行转换的字符串。
2.toUpperCase0方法
该方法将字符串中所有的小写字母转换为大写。如果字符串中没有应该被转换的字符,则将原字符
串返回;否则返回一个新字符串,将原字符串中每个小写字母都转换成大写,字符串长度不变。语
法如下:
strtoUpperCase()
str是要进行转换的字符串
例题如下:
10.4.8字符串分割
使用split0方法可以使字符串按指定的分割字符或字符串进行分割,并将分割后的结果存放在字符
串数组中。split0方法提供了以下两种字符串分割形式。
1. split(String sign)该方法可根据给定的分割符对字符串进行拆分。语法如下:
str.split(String sign)
其中,sign为分割字符串的分割符,也可以使用正则表达式。
2. split(String sign,int limit)
该方法可根据给定的分割符对字符串进行拆分,并限定拆分的次数。语法如下:
str.split(String sign,int limit)
sign: 分割字符串的分割符,也可以使用正则表达式。
limit: 限制的分割次数。
例题如下:
10.5格式化字符串
String类的静态format0方法用于创建格式化的字符串。format0方法有两种重载形式
1. format(String format,Object...args)该方法使用指定的格式字符串和参数返回一个格式化字符
串,格式化后的新字符串使用本地默认的语言环境。语法如下:
str.format(String format,Object...args)
format: 格式字符串
args:格式字符串中由格式说明符引用的参数。
如果还有格式说明符以外的参数,则忽略这些额外的参数。此参数的数目是可变的,可以为0。
2. format(LocallStringformat,Object...args)
该方法使用指定的语言环境、格式字符串和参数返回一个格式化字符串,格式化后的新字符串使用其指定的语言环境。语法如下:
str.format(Local l,String format,Object...args)
l: 格式化过程中要应用的语言环境。如果I为null,则不进行本地化。
format: 格式字符串
args:格式字符串中由格式说明符引用的参数。如果还有格式说明符以外的参数,则忽略这些额外
的参数。此参数的数目是可变的,可以为0。
10.5.1日期和时间字符串格式化
在应用程序设计中,经常需要显示日期和时间。如果想输出满意的日期和时间格式,一般需要编写
大量的代码、经过各种算法才能实现。format0方法通过给定的特殊转换符作为参数来实现对日期
和时间的格式化。
1.日期格式化
先来看一个例子。返回一个月中的天数,代码如下:
Date date = new Date(); //建Date对象date
String s = String.format("%te", date); //通过format0方法对date进行格式化
上述代码中变量s的值是当前日期中的天数如今天是15号,则s的值为15;%te是转换符。常用的日
期格式化转换符如下表所示
常用的日期格式化转换符
例题如下:
2. 时间格式化
使用format0方法不仅可以完成日期的格式化,也可以实现时间的格式化。时间的格式化转换符要
比日期的格式化转换符更多、更精确,它可以将时间格式化为时、分、秒、毫秒等。格式化时间的转换符如下表所示:
例题如下:
3. 格式化常见的日期时间组合
格式化日期与时间组合的转换符定义了各种日期时间组合的格式,其中最常用的如下表所示:
例题如下:
10.5.2 常规类型格式化
常规类型格式化可应用于任何参数类型,通过如下表所示的转化符来实现:
例题如下:
10.6使用正则表达式
正则表达式通常被用于判断语句中,用来检查某一字符串是否满足某一格式。正则表达式是含有一
些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如 ,"\\d"表示数字0~9
中的任何一个,"\d"就是元字符。正则表达式中的元字符及其意义如下表所示:
在正则表达式中,可以使用方括号括起若干个字符来表示一个元字符,该元字符可代表方括号中的
任何一个字符。例如,reg ="[abc]4",这样字符串a4、b4、c4都是和正则表达式匹配的字符串。方
括号元字符还可以为其他格式。如:
[^456]:代表4、5、6之外的任何字符。
[a-r]: 代表a~r中的任何一个字母
[a-ZA-z]: 可表示任意一个英文字母
[a-e[g-z]]:代表a ~e或g~z中的任何一个字母(并运算)
[a-o&&[def]]:代表字母d、e、f (交运算)
[a-d&&[^bc]]:代表字母a、d(差运算)
在正则表达式中允许使用限定修饰符来限定元字符出现的次数。例如,““A*”代表A可在字符串中出
现0次或多次。限定修饰符的用法如下表所示:
例题如下:
正则表达式分析:
通常情况下E-mail的格式为“X@X.com.cn”。字符X表示任意的一个或多个字符,@为E-mail地址中
的特有符号,符号@后还有一个或多个字符,之后是字符".com",也可能后面还有类似"cn"的标
记。总结E-mail地址的这些特点,可以书写正则表达式"\\w+@\\w+(\\.\\w{2,3})*\\.\\w{2,3})”来匹配E-
mail 地址。字符集lw”匹配任意字符,符号表示字符可以出现1次或多次,表达式"(l.llw2,3))*"表示形
如".com"格式的字符串可以出现0次或多次。而最后的表达式”lllw23)”用于匹配E-mail地址中的结尾
字符,如'.cn' 。
10.7字符串生成器
创建成功的字符串对象,其长度是固定的,内可以达容不能被改变和编译。虽然使用“+”到附加新
字符或字符串的目的,但“+”会产生一个新的String实例,会在内存中创建新的字符串对象。如果重
复地对字符串进行修改将极大地增加系统开销。而JDK新增了可变的字符序列StringBuilder类,大
大提高了频繁增加字符串的效率。
例题如下:
通过这一实例可以看出,两种操作执行的时间差距很大。如果在程序中频繁地附加字符串,建议使
用StringBuilder类。新创建的StringBuilder对象初始容量是16个字符,可以自行指定初始长度。如
果附加的字符超过可容纳的长度,则StringBuilder对象将自动增加长度以容纳被附加的字符。若要
使用StringBuilder类最后输出字符串结果,可使用toString0方法。利用StringBuilder类中的方法可
动态地执行添加、删除和插入等字符串的编辑操作。该类的常用方法如下 。
1.append0方法
该方法用于向字符串生成器中追加内容。通过该方法的多个重载形式,可实现接受任何类型的数
据,如int、boolean、char、 String、double或者另一个字符串生成器等。语法如下:
append(content)
其中,content表示要追加到字符串生成器中的内容,可以是任何类型的数据或者其他对象。
2.insert(int offset, arg)方法
该方法用于向字符串生成器中的指定位置插入数据内容。通过该方法的不同重载形式,可实现向字
符串生成器中插入int、float、char和boolean等基本数据类型的数据或其他对象语法如下:
insert(int offset arg)
offset:字符串生成器的位置。该参数必须大于等于0,且小于等于此序列的长度。
arg: 将插入至字符串生成器的位置。该参数可以是任何数据类型的数据或其他对象。
向字符串生成器中指定的位置添加字符,代码如下:
StringBuilder bf = new StringBuilder("hello"); //创建字符生成器
bf.insert(5,"world”); //添加至字符生成器的位置及内容
System.outprintin(bf.toString)); //此时输出信息为 helloworld
3.delete(int start ,int end)方法
移除此序列的子字符串中的字符。该子字符串从指定的start处开始,一直到索引end-1处的字符。
如果不存在这种字符,则一直到序列尾部。如果start等于end,则不发生任何更改。语法如下:
delete(int start ,int end)
start:将要删除的字符串的起点位置。
end:将要删除的字符串的终点位置。
删除指定位置的子字符串,代码如下 :
StringBuilder bf = new StringBuilder("StringBuilder"); //创建字符串生成器
bf.delete(5,10); //删除的子字符串
System.out.println(bf.toString()); //此时输出的信息为 Strinder