在Hadoop里面经常看到有StringTokenizer,用来分割字符串。
那么在这里就简单地了解一下这个类到底有什么用。
1. StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。
java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
2. StringTokenizer(String str, String delim):构造一个用来解析str的StringTokenizer对象,
并提供一个指定的分隔符。
3. StringTokenizer(String str, String delim, boolean returnDelims):
构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,
同时,指定是否返回分隔符。
2、常用方法。
static int parseInt(String s)表示:此方法(parseInt)为类方法(static),
返回类型为(int),方法所需参数为String类型。
1. int countTokens():返回nextToken方法被调用的次数。
如果采用构造函数1和2,返回的就是分隔符数量(例2)。
2. boolean hasMoreTokens() :返回是否还有分隔符。
3. boolean hasMoreElements() :返回是否有下一个元素。
4. String nextToken():返回从当前位置到下一个分隔符的字符串。
5. Object nextElement() :返回到下一个分隔符的对象。
6. String nextToken(String delim):返回当前位置的下一个分隔符。
public class TestOfStringTokenizer {
2.
3. public static void main(String[] args) {
4.
5. String str = new String("Java JavaScipt C++ Shell PLSQL PYTHON") ;
6. str = str + "\nhello\nworld" ;
7. str = str + ",Kiss,my,ass" ;
8. //StringTokenizer st = new StringTokenizer(str," ",true);
9. StringTokenizer st = new StringTokenizer(str);
10. System.out.println( "Token Total: " + st.countTokens() );
11. while( st.hasMoreElements() ){
12. System.out.println( st.nextToken() );
13. }
14. }
15.}
切分CSV文件
public class TestOfStringTokenizer {
2.
3. public static void main(String[] args) {
4.
5. String str = new String("Tomorrow,i,will,go,to,school,alone") ;
6. str = str + ",because,someone,want,to,Kiss,my,ass" ;
7. StringTokenizer st = new StringTokenizer(str,",",true);
8. System.out.println( "Token Total: " + st.countTokens() );
9. while( st.hasMoreElements() ){
10. System.out.println( st.nextToken() );
11. }
12. }
13.}