给定一篇英文文章,找出其中使用频率最高的英语单词。

原创 2015年11月17日 19:40:05

  这道题,对于学java的练习的学友来说是一道不可缺少的题目,这一道题,我刚一开始接触的时候认为挺简单的一道题,但是在做的时候发现了很多问题,其中对于map的运用,对于遍历的操作,以及对键值对的理解等。
  

“`
import java.io.BufferedReader;
import java.io.FileReader;
import java.security.KeyStore.Entry;
import java.util.ArrayList;
import java.util.Collections;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.StringTokenizer;

public class Map_t {

public static void main(String[] args) throws Exception {

    BufferedReader reader = new BufferedReader(new FileReader("1.txt"));//1.txt是在同一目录下的。
    StringBuffer buffer = new StringBuffer();
    String line = null;
    while ((line = reader.readLine()) != null) {
        buffer.append(line);
    }
    reader.close();//以上是对文件的读取,就是读取文章
    String string = buffer.toString();
    String[] word = new String[1000];//定义一个数组,来储存文章中的单词,没有用List,感觉用集合的话更好,这里有限制,是1000.
    StringTokenizer st = new StringTokenizer(string,";!., ");//去除文章中的几个符号,当然这只是一些符号,还有一些没有写上,所以不全面。
    Map<String,Integer>m = new HashMap<String,Integer>();
    int x = 0;
    while( st.hasMoreElements() ){
        String w = st.nextToken();
        word[x] = w;
        m.put(w, 0);//哈希的方法将重复的单词去除,存入m中。
        x++;
    }
   Set<String> set = m.keySet();
    for(int i=0;word[i]!=null;i++){
        Iterator<String> it = set.iterator();
         while(it.hasNext()){//遍历找出每个单词有多少个
              String k = it.next();
              if(word[i].equals(k)){
                    int c = m.get(k);                  
                    c++;
                    m.put(word[i],c);

              }
         }

   }
    int value=0;
    String maxKey = null;
    Iterator itor=m.entrySet().iterator();   
    List list=new ArrayList();
    while(itor.hasNext()){ //在遍历让找出最多的单词有几个。  

        Map.Entry<String,Integer> entry=(Map.Entry<String,Integer>)itor.next();   
        list.add(entry.getValue());

        Collections.sort(list);

        value = Integer.parseInt(list.get(list.size()-1).toString());
    }

    Iterator it=m.entrySet().iterator();
    while (it.hasNext()){//遍历找出最多的数对应的单词。 
        Map.Entry mapentry = (Map.Entry) it.next(); 
        if((int)mapentry.getValue()==value){
            System.out.println(mapentry.getKey() ``

“/” + mapentry.getValue());
}
}

}

}

“`上面是代码,当然还是有一定的不足,我认为写的有点复杂了,暂时没有想到更好的方法,也希望谁有更好的方法告诉我,其中运用了很多集合中的知识。学到的也挺多。

相关文章推荐

LCD 画线算法及C语言实现

LCD 画线方法及C语言实现(转贴)    http://www.dianyuan.com/article/43522 显示器上与数学上直线定义的区别:      数学上的直线是...

Python学习第四篇:利用python抓取英语单词

利用python爬取英语单词和释义。

计算一篇文章中单词出现的频率,并把输出频率最高的十五个单词输出来

#include #include"string.h" #define WORDNUM 65535 // max word number #define WORDLENGTH 15 // wor...

统计文章出现频率最高的单词 2011211554

目标:统计文章出现频率最高的单词,输出频率最高的前十个单词。 以下是分析的具体内容: (1)首先是cpu使用百分率:总执行时间为29.3秒,截图如下 (2)各函数占用时间如下图: ...

使用频率最高的1000句英语

  • 2009年01月05日 13:31
  • 128KB
  • 下载

]使用频率最高的一千句英语

  • 2010年04月10日 09:31
  • 376KB
  • 下载

程序员求职之道(《程序员面试笔试宝典》)之海量数据处理(如何从10亿查询词找出出现频率最高的10个)?

1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门...
  • xdhehao
  • xdhehao
  • 2012年08月10日 20:03
  • 2102

使用频率最高的英语短语296句

  • 2008年06月26日 13:51
  • 4.64MB
  • 下载

怎样从10亿查询词找出出现频率最高的10个

1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索...

水贴王之续,找出数组里出现频率最高的元素

找出数组里出现频率最高的元素
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:给定一篇英文文章,找出其中使用频率最高的英语单词。
举报原因:
原因补充:

(最多只允许输入30个字)