java 统计文章中每个单词出现的次数

思路:扫描文章,使用正则表达式分割出一个个单词,

然后把这个单词放到map<String,Integer>集合中作为key,同时它的value置1,以后每扫描到一个单吃都去检查map里面有没有这个单词,如果有value就加1,然后再放回map中更新value。

package pattern;

import java.io.File;
import java.io.FileNotFoundException;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Scanner;
import java.util.Set;

public class splitWords
{
	public static void main(String[] args) throws FileNotFoundException
	{
		File file=new File("C:\\Users\\Administrator\\Desktop\\English.txt");
		if(!file.exists())
		{
			System.out.println("文件不存在");
			return;
		}
		Scanner scanner=new Scanner(file);
		//单词和数量映射表
		HashMap<String, Integer > hashMap=new HashMap<String,Integer>();
		System.out.println("文章-----------------------------------");
		while(scanner.hasNextLine())
		{
			String line=scanner.nextLine();
			System.out.println(line);
			//\w+ : 匹配所有的单词
			//\W+ : 匹配所有非单词
			String[] lineWords=line.split("\\W+");//用非单词符来做分割,分割出来的就是一个个单词
			
			Set<String> wordSet=hashMap.keySet();
			for(int i=0;i<lineWords.length;i++)
			{
				//如果已经有这个单词了,
				if(wordSet.contains(lineWords[i]))
				{
					Integer number=hashMap.get(lineWords[i]);
					number++;
					hashMap.put(lineWords[i], number);
				}
				else 
				{
					hashMap.put(lineWords[i], 1);
				}
			}
			
		}
		System.out.println("统计单词:------------------------------");
		Iterator<String> iterator=hashMap.keySet().iterator();
		while(iterator.hasNext())
		{
			String word=iterator.next();
			
//			System.out.printf("单词: "+word+"出现次数:"+hashMap.get(word));
			System.out.printf("单词:%-12s 出现次数:%d\n",word,hashMap.get(word));
		}
		
		
		System.out.println("程序结束--------------------------------");
	}
}
文章:
"C:\\Users\\Administrator\\Desktop\\English.txt"

Studies serve for delight, for ornament, and for ability.
Their chief use for delight.
运行结果:

文章-----------------------------------
Studies serve for delight, for ornament, and for ability.
Their chief use for delight.
统计单词:------------------------------
单词:Studies      出现次数:1
单词:ornament     出现次数:1
单词:and          出现次数:1
单词:chief        出现次数:1
单词:use          出现次数:1
单词:for          出现次数:4
单词:Their        出现次数:1
单词:serve        出现次数:1
单词:ability      出现次数:1
单词:delight      出现次数:2
程序结束--------------------------------



  • 13
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值