当我们想要对一个字符串进行切分出它的一些字串的时候,我们可以使用split方法和StringTokenizer类
一、lang包中的String类下的split()方法:
public String[] split(String regex)
public String[] split(String regex,int limit)
他们都是返回一个String类型的数组,regex是指划分出字串的分隔符,limit用来控制模式应用的次数,影响所得数组的长度
提示:
“|”、“.”、“*”、“+”、“\”等不是有效的模式匹配规则表达式,是转义字符,使用split()方法时必须得加"\"才行。
二、util包中的StringTokenizer类:
通过生成一个StringTokenizer类的对象,再引用它的属性来实现字符串的拆分
public StringTokenizer(String str,String regex,boolean return_regex)
public StringTokenizer(String str,String regex)
public StringTokenizer(String str)
str:要被分割的字符串
regex:划分出字串的分隔符
return_regex:是否将分隔符作为标记返回
StringTokenizer的一些方法:
public int countTokens()//返回使用当前分隔符集剩下的字符串中的令牌数
eg:
StringTokenizer st = new StringTokenizer("T is the best site");
System.out.println("Total tokens:"+st.countTokens());
结果: Total tokens:5
public String nextToken(String regex) //在方法调用返回的下一个标记,切换到新的分隔符集后。
eg:
StringTokenizer st = new StringTokenizer("Come/to/learn");
System.out.println("Next token is : " + st.nextToken("/"));
结果:Next token is : Come
public boolean hasMoreTokens()//该方法调用返回true,当且仅当出现在字符串中至少有一个令牌的当前位置之后;否则为false。
eg:
StringTokenizer st = new StringTokenizer("Come to learn");
System.out.println("Total tokens : " + st.countTokens());
while (st.hasMoreTokens()){
System.out.println("Next token : " + st.nextToken());
}
结果:
Total tokens : 3
Next token : Come
Next token : to
Next token : learn
练习一:
用String.split()方法将字符串“aaa|bbb|ccc”以“|”进行拆分,用StringTokenizer类将字符串“This?is?a?test?string”以“?”进行拆分。
package step1;
import java.util.List;
import java.util.ArrayList;
import java.util.StringTokenizer;
public class StudentDemo{
//使用String.split()方法分割
public List<String> splitPartition(String str){
List<String> list=new ArrayList<String>();
String[] each_list =str.split("\\|");
for(String s:each_list){
list.add(s);
}
return list;
}
//使用StringTokenizer类进行分割
public List<String> tokenPartition(String str){
List<String> list=new ArrayList<String>();
StringTokenizer t=new StringTokenizer(str,"?");
while(t.hasMoreTokens()){
list.add(t.nextToken());
}
return list;
}
}
练习二:
请仔细阅读右侧代码,根据方法内的提示,在Begin - End区域内进行代码补充,具体任务如下:
列出给定字符串中每个单词(按“ ”,“,”,“?”,“.”,“!”,“:”,“\n”分割)首次出现的位置。
测试输入:
No arguments will give courage to the coward.
预期输出:
单词:the—首次出现的角标34
单词:No—首次出现的角标0
单词:give—首次出现的角标18
单词:will—首次出现的角标13
单词:arguments—首次出现的角标3
单词:to—首次出现的角标31
单词:coward—首次出现的角标38
单词:courage—首次出现的角标23
package step2;
import java.util.Map;
import java.util.HashMap;
import java.util.StringTokenizer;
public class StudentDemo{
//返回一个Map集合来得到单词和首次出现的下标 key为单词名称 value为单词的角标
public Map<String, Integer> getMap(String str){
Map<String, Integer> map = new HashMap<String, Integer>();
//对str进行分割 再加入map集合中
//请在此添加实现代码
/********** Begin **********/
StringTokenizer t=new StringTokenizer(str," |\\,\\?\\.\\!\\:\\\n");
while(t.hasMoreTokens()){
String ch=t.nextToken();
int index=str.indexOf(ch);
map.put(ch,index);
}
/********** End **********/
return map;
}
}