Input some English sentences, count and print the numbers of all the words and each different words.
/**
* Created by 孙月晴 on 2017/7/18.
*/
import java.util.Scanner;
import java.util.HashMap;
import java.util.StringTokenizer;
import java.util.Set;
public class WordCount {
public static void main(String[] args) {
System.out.println("input english sentences:");
Scanner in = new Scanner(System.in);
String sentances = in.nextLine();
HashMap<String,Integer> hm = new HashMap<String,Integer>();
StringTokenizer itr = new StringTokenizer(sentances);
System.out.println("totoal numbers:"+itr.countTokens());
while (itr.hasMoreTokens()) {
String word= itr.nextToken();
if (!hm.containsKey(word)){
hm.put(word, 1);
}else{
hm.put(word,hm.get(word).intValue()+1);
}
}
Set<String> keys = hm.keySet();
for (String str : keys) {
System.out.println(str+":"+hm.get(str));
}
}
}
运行结果:
缺点:不能区分标点符号
补充:
StringTokenizer是字符串分隔解析类型,属于:Java.util包。
1.StringTokenizer的构造函数
StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
StringTokenizer(String str,String delim):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。
StringTokenizer(String str,String delim,boolean returnDelims):构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。
2.StringTokenizer的一些常用方法
说明:
1.所有方法均为public;
2.书写格式:[修饰符] <返回类型><方法名([参数列表])>
int countTokens():返回nextToken方法被调用的次数。
boolean hasMoreTokens():返回是否还有分隔符。
boolean hasMoreElements():返回是否还有分隔符。
String nextToken():返回从当前位置到下一个分隔符的字符串。
Object nextElement():返回从当前位置到下一个分隔符的字符串。
String nextToken(String delim):与4类似,以指定的分隔符返回结果。