A:
StringTokenizer:字符串分隔解析类型
属于:java.util包。
1、构造函数。
1. StringTokenizer(String str) :构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
2. StringTokenizer(String str, String delim) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。
3. StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。
2、方法。
说明:
1. 所有方法均为public;
2. 书写格式:[修饰符] <返回类型> <方法名([参数列表])>
如:
static int parseInt(String s) 表示:此方法(parseInt)为类方法(static),返回类型为(int),方法所需参数为String类型。
1. int countTokens() :返回nextToken方法被调用的次数。如果采用构造函数1和2,返回的就是分隔符数量(例2)。
2. boolean hasMoreTokens() :返回是否还有分隔符。
3. boolean hasMoreElements() :结果同2。
4. String nextToken() :返回从当前位置到下一个分隔符的字符串。
5. Object nextElement() :结果同4。
6. String nextToken(String delim) :与4类似,以指定的分隔符返回结果。
例子:
String s = new String("The Java platform is the ideal platform for network computing");
StringTokenizer st = new StringTokenizer(s);
System.out.println( "Token Total: " + st.countTokens() );
while( st.hasMoreElements() ){
System.out.println( st.nextToken() );
}
结果为:
Token Total: 10
The
Java
platform
is
the
ideal
platform
for
network
computing
例2:
String s = new String("The=Java=platform=is=the=ideal=platform=for=network=computing");
StringTokenizer st = new StringTokenizer(s,"=",true);
System.out.println( "Token Total: " + st.countTokens() );
while( st.hasMoreElements() ){
System.out.println( st.nextToken() );
}
结果为:
Token Total: 19
The
=
Java
=
platform
=
is
=
the
=
ideal
=
platform
=
for
=
network
=
computing
B:
Java分割字符串,一般使用substring、split、StringTokenizer来处理,前两种是String对象的方法,使用字符串可以直接处理,本文介绍下StringTokenizer的使用。
StringTokenizer 的实例化使用new的方式。
构造方法最多有3个参数:
StringTokenizer(String str, String delim, boolean returnDelims)
1
1
第一个参数为我们要处理的字符串。
第二个参数为我们分割字符串的分割标记字符。delim的默认值为” \t\n\r\f”(前面有一个空格,不包括双引号)
第三个参数意思是,是否包含分割标记字符本身。默认值为false。
StringTokenizer 中的方法hasMoreElements()和hasMoreElements()的用法是一样的,只是StringTokenizer为了实现Enumeration接口而实现的方法。
StringTokenizer 中的方法nextElements()和nextToken()的用法是一样的,返回StringTokenizer的下一个标记。
下面给出一个实例:
public static void main(String[] args) {
StringBuffer str = new StringBuffer();
String s = "|struts.xml,1451210087873.xml,.xml,#OA数据库脚本.txt,1451210087857.txt,.txt,";
// for (int i = 0; i < 500000; i++) {
str.append(s);
// }
String temp = null;
long begin = System.currentTimeMillis();
StringTokenizer token = new StringTokenizer(str.toString(),"|#");
while(token.hasMoreTokens()){
temp = token.nextToken();
StringTokenizer token1 = new StringTokenizer(temp,",");
if(token1.hasMoreTokens()){// 只取第一个即可
System.out.println(token1.nextToken());
}
}
System.out.println("耗时:" + (System.currentTimeMillis() - begin));// 9460
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
本例为了输出文件名,直接使用了“|”和“#” 都支持的效果。
相比String的substring和split来说,StringTokenizer更好。
小数据量方面体现不出什么,如果是大数据操作,StringTokenizer 的性能理论上是优与其他两种的。