java 统计单词个数_JAVA实验--统计文章中单词的个数并排序

这个Java程序用于统计文本文件中单词的出现次数,并按出现频率进行排序。程序首先读取“Harry Potter and the Sorcerer's Stone.txt”文件,使用HashMap存储单词及其出现次数,然后输出前10个最常出现的单词及其次数。
摘要由CSDN通过智能技术生成

packagepipei;//洪鼎淇 20173627 信1705-3

importjava.io.File;importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStreamReader;importjava.io.OutputStreamWriter;importjava.util.HashMap;importjava.util.Map;//哈利波特单词统计

public classPipei {public Map map1=new HashMap();public static voidmain(String arg[]) {

String sz[];

Integer num[];final int MAXNUM=10; //统计的单词出现最多的前n个的个数

sz=new String[MAXNUM+1];

num=new Integer[MAXNUM+1];

Pipei pipei=newPipei();int account =1;//Vector ve1=new Vector();

try{

pipei.daoru();

}catch(IOException e) {//TODO 自动生成的 catch 块

e.printStackTrace();

}

System.out.println("英文单词的出现情况如下:");int g_run=0;for(g_run=0;g_run

{

account=1;for(Map.Entryit : pipei.map1.entrySet())

{if(account==1)

{

sz[g_run]=it.getKey();

num[g_run]=it.getValue();

account=2;

}if(account==0)

{

account=1;continue;

}if(num[g_run]

{

sz[g_run]=it.getKey();

num[g_run]=it.getValue();

}//System.out.println("英文单词: "+it.getKey()+" 该英文单词出现次数: "+it.getValue());

}

pipei.map1.remove(sz[g_run]);

}int g_count=1;

String tx1=newString();for(int i=0;i

{if(sz[i]==null)continue;if(sz[i].equals(""))continue;

tx1+="出现次数第"+(g_count)+"多的单词为:"+sz[i]+"\t\t\t出现次数: "+num[i]+"\r\n";

System.out.println("出现次数第"+(g_count)+"多的单词为:"+sz[i]+"\t\t\t出现次数: "+num[i]);

g_count++;

}try{

pipei.daochu(tx1);

}catch(IOException e) {//TODO 自动生成的 catch 块

e.printStackTrace();

}

}public void daoru() throwsIOException

{

File a=new File("1.Harry Potter and the Sorcerer's Stone.txt");

FileInputStream b= newFileInputStream(a);

InputStreamReader c=new InputStreamReader(b,"UTF-8");

String string2=newString();while(c.ready())

{char string1=(char) c.read();if(!isWord(string1))

{if(map1.containsKey(string2))

{

Integer num1=map1.get(string2)+1;

map1.put(string2,num1);

}else{

Integer num1=1;

map1.put(string2,num1);

}

string2="";

}else{

string2+=string1;

}

}if(!string2.isEmpty())

{if(map1.containsKey(string2))

{

Integer num1=map1.get(string2)+1;

map1.put(string2,num1);

}else{

Integer num1=1;

map1.put(string2,num1);

}

string2="";

}

c.close();

b.close();

}public void daochu(String txt) throwsIOException

{

File fi=new File("tongji.txt");

FileOutputStream fop=newFileOutputStream(fi);

OutputStreamWriter ops=new OutputStreamWriter(fop,"UTF-8");

ops.append(txt);

ops.close();

fop.close();

}public boolean isWord(chara)

{if(a<='z'&&a>='a'||a<='Z'&&a>='A')return true;return false;

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值