软件工程第一次作业
问题定义:
写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。
可行性研究:
技术上:问题主要在于分词,键值存储和排序。利用String可以很方便的进行分词;map中的键保存词,值保存出现的次数;最后将map中的键值对按值降序排序。
经济上:利用开源继承开发工具eclipse即可很方便的实现编码和测试。
需求分析:
很多文本编辑器和阅读器都可以很方便的进行词数统计,但很少有进行词频统计的功能且很少使用。对一个文本来说,出现最多的词往往都是体现主题甚至就是主题,进行词频统计可以很方便的进行文本的较深一步的分析。
总体设计:
输入:程序自动加载文本位置,文件流输入。
输出:按词频降序输出在控制台。
界面:无界面(控制台)。
数据结构:map,键保存词,值保存出现的次数。
详细设计:
main函数作为程序入口,调用其它函数实现功能。
输入:用BufferedReader带缓冲的输入加速输入,按行(readLine)读入。