题目: 写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。
分析:
我觉得这个题目的一个难点就是如何分词,我认为 分词的方法是将逐字符的判断一篇文章,为了防止标点符号也被读入到单词中,导致单词的数据统计有误,所以采用了一个字符一个字符读取的方法,同时将字符限定在'a--z','A--Z'之间,这样单词的统计以及大小写就不会出错了。剩下的事就相对比较简单了,统计词的个数及打印频率最高的词。
性能分析:
1.CPU usage
开始时间:22:27:03
2.查看使用堆的规模的变化
3.加载的类的总数的变化
4.活动程序与后台程序的变化情况
第一次用visualVM编写代码,还是有很多不熟悉的命令与功能,自己要更加努力,希望下次可以做得更好。