作业要求:
写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。
程序实现思路:
要想统计文本文件中出现频率最高的10个词,首先应该读取文本文件中的内容,然后将其数据存储到集合中,利用集合中的一些方法对所有出现的字进行次数统计。统计完之后,对集合进行排序,将出现频率最高的10个字打印输出。
1、读取文本文件
使用输入字节流类FileReader与BufferedReader。
将文本中的数据赋给s以实现后续操作。
2、将数据存储到Map集合中
因为该输出结果中,出现的字与其次数存在着映射关系,因此采用HashMap集合对数据进行操作。
对于词出现次数的统计,将读取到每一个字存入集合中,如果该字与集合中存在的字相同,则其value+1,如果没有找到相同的字,则令其value=1。