Java字符串分割

一、split()方法

public String[] split(String regex)  
public String[] split(String regex,int limit) 
参数说明:

regex:用于划分的正则表达式

limit:参数控制模式应用的次数,影响所得数组的长度。这个值可正可负可为零。limit为正数,表示返回的数组中元素的个数。

示例:

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {
		
		String t2 = "a:b:c:d:e:f";
		String[] split3 = t2.split(":",3);
		for(String s:split3)
		{
			System.out.println(s);
		}
	}
}
结果:

a
b
c:d:e:f

常用分隔符注意事项:
1、"|"、"*"、"+" 、"."都必须加上转译字符,即前面加上"\\"。
2、还有一个更特殊的,如果分隔符是"\",那就必须写成"\\\\"。
3、如果一个字符串中有多个分隔符,可以用"|"作为连接字符。如: String str = "我#爱-你",则可以写成str.split("#|-")

二、StringTokenizer

StringTokenizer是一个用来分割String的应用类。这个类是出于兼容性的原因而被保留的遗留类,所以并不建议使用它,建议使用String类中的split()方法进行字符串切割

1、构造函数

StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
StringTokenizer(String str, String delim):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。
StringTokenizer(String str, String delim, boolean returnDelims):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。

参数说明:

str:要分割的String

delim:分割字符集合

returnDelims:表示分割符号是否作为标记返回。

2、常用方法

int countTokens():返回nextToken方法被调用的次数。如果采用构造函数1和2,返回的就是分隔符数量。
boolean hasMoreTokens() :返回是否还有分隔符。
boolean hasMoreElements() :结果同2。
String nextToken():返回从当前位置到下一个分隔符的字符串。
Object nextElement() :结果同4。
String nextToken(String delim):与4类似,以指定的分隔符返回结果。

示例:

package com.learns.string;

import java.util.StringTokenizer;

public class StringTokenizerTest {
	public static void main(String[] args) {
		String s = new String("The Java platform is the ideal platform for network computing");
		StringTokenizer st = new StringTokenizer(s," ",false);
		System.out.println( "Token Total: " + st.countTokens() );
		while( st.hasMoreElements() )
		{
			Object str = st.nextElement();
			System.out.println(str);
		}
	}
}
结果:
Token Total: 10
The
Java
platform
is
the
ideal
platform
for
network
computing

三、区别

性能比较:

package com.learns.string;

import java.util.StringTokenizer;
import java.util.Vector;

public class test {

	public static void main(String[] args) {
		String str = "abc";
		StringBuffer buffer = new StringBuffer();
		
		for(int i=0;i<1_000_000;i++)
		{
			buffer.append(str).append(" ");
		}
		
		str = buffer.toString();
		
		// StringTokenizer
		long curTime = System.currentTimeMillis();
		StringTokenizer token = new StringTokenizer(str," ");
		String[] array2 = new String[token.countTokens()];
		int i=0;
		while(token.hasMoreTokens())
		{
			array2[i++] = token.nextToken();
		}
		System.out.println("java.util.StringTokener:"+(System.currentTimeMillis()-curTime));
		
		// split方法
		curTime = System.currentTimeMillis();
		String[] array = str.split(" ");
		System.out.println("String.split:" + (System.currentTimeMillis()-curTime));
		
		// indexOf方法
		curTime = System.currentTimeMillis();
		Vector<String> vector = new Vector<String>();
		int index = 0;
		int offset = 0;
		while((index = str.indexOf(" ",index+1))!=-1)
		{
			vector.addElement(str.substring(offset,index));
			offset = index+1;
		}
		String[] array3 = vector.toArray(new String[0]);
		System.out.println("Vector & indexof:"+(System.currentTimeMillis() - curTime));
	}
}
结果:

java.util.StringTokener:550
String.split:1052
Vector & indexof:159

解释StringTokenizer性能高于split方法,indexof性能最高

区别1:

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {
		String sample1 = "ben       ben";
		String[] split1 = sample1.split(" ");
		StringTokenizer tokens = new StringTokenizer(sample1," ");
		System.out.println(split1.length + " " + tokens.countTokens());
	}
}
结果:

8 2
解释:如果用split进行分离的话,他会将空格也作为一个字符串存入数组, 而StringTokenizer不会

区别2:

package com.learns.string;

import java.util.StringTokenizer;

public class test3 {

	public static void main(String[] args) {	
		String t1 = "ben, ,,  ,,,ben";
		String[] split2 = t1.split(",");
		StringTokenizer tokens = new StringTokenizer(t1,",");
		System.out.println(split2.length + " " + tokens.countTokens());
	}
}
结果:

7 4
解释:StringTokenizer会将连续相同的需要过滤的进行处理


参考文章:

http://ben-sin.iteye.com/blog/659611

https://my.oschina.net/jasonli0102/blog/272061

http://blog.csdn.net/e_wsq/article/details/32068337


  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值