单词统计

词频统计

做一个词频统计程序,该程序具有以下功能
(1)可导入任意英文文本文件
(2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。
(3)将单词及频率写入文件。

package shangji;

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.TreeMap;
import java.util.Map;
import java.util.Iterator;


/**
 * 利用类TreeMap<K,V>基于红黑树的Map接口实现
 * K:键的类型
 * V:映射值的类型
 */

public class WordCount {
	
	public static void main(String[] args) throws FileNotFoundException,IOException{
	
		try{
		
		//使用流的方法读取文件
		BufferedReader br = new BufferedReader(new FileReader("C:\\wordlist.txt"));
		
		//使用TreeMap方法自动将结果按Integer列
		TreeMap<String,Integer> treemap = new TreeMap<String,Integer>();
		
		//用来存储读取的单词
		String readLine = null;
		
		//记录单词的总数
		int count = 0;
		
		while((readLine = br.readLine())!=null){
			
			//将字母排序为小写
			readLine = readLine.toLowerCase();
			
			//将所有单词以大写输出
			//readLine  = readLine.toUpperCase();
			
			//过滤出只含有字母的字段
			String[] str = readLine.split("[\\s]");
			
			//过滤掉多个空格,“+”代表多个空格的意思
			for(int i = 0;i<str.length;i++){
				
				count++;
				String word = str[i].trim();//trim()用来去掉字符串首尾的空格
				
				if(treemap.containsKey(word)){//判断此映射是否包含指定键的映射关系
					treemap.put(word, treemap.get(word)+1);
				}else{
					treemap.put(word, 1);
				}
			}
		}
		
		System.out.println("按字典的输出顺序为:");
		System.out.println("单词:"+"\t"+"单词出现的频率:" );
		
		/**
		 * 使用迭代器遍历取值:
		 * Iterator是迭代器
		 * treemap.entrySet()是把TreeMap类型的数据转换成集合类型
		 * treemap.entrySet().iterator()获取集合的迭代器
		 */
		 
		Iterator<Map.Entry<String,Integer>> it  = treemap.entrySet().iterator();
		//判断是否存在下一个单词
		while(it.hasNext()){
			
			Map.Entry<String, Integer> entry = it.next();//获取map中每一个键值
			//输出结果
			System.out.println(entry.getKey()+"        "+entry.getValue());
			
			br.close();//关闭流
			}
		System.out.println("单词总数为:"+count+"个");
		
		}catch(FileNotFoundException e){//异常处理
			e.printStackTrace();
		}catch(IOException e){
			e.printStackTrace();
		}
	}
}

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值