一、需求分析:
给定一篇文档,请对其高频词进行统计,并输出高频词top10。
二、解决思路:
对高频词进行统计,主要是对字符串进行分割,并对其出现的频率进行存储和统计。存储字符串频率可用HashMap的数据结构进行存储,但是HashMap本身是无序的,故需按照频率高低进行自定义排序。
三、具体编码:
package com.zhuke.countWord;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;
import java.util.Map;
/**
* 统计一个文件中各词出现的频率,并打印出前10位
*
* @author ZHUKE
*
*/
public class CountWord {
// 使用HashMap来存储单词的频率<