软件工程第一次作业:java实现分析一个文本文件中各个词出现的频率,并输出频率最高的10个词

软件工程第一次作业

问题定义:

写一个程序,分析一个文本文件中各个词出现的频率,并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。

可行性研究:

技术上:问题主要在于分词,键值存储和排序。利用String可以很方便的进行分词;map中的键保存词,值保存出现的次数;最后将map中的键值对按值降序排序。

经济上:利用开源继承开发工具eclipse即可很方便的实现编码和测试。

需求分析:

很多文本编辑器和阅读器都可以很方便的进行词数统计,但很少有进行词频统计的功能且很少使用。对一个文本来说,出现最多的词往往都是体现主题甚至就是主题,进行词频统计可以很方便的进行文本的较深一步的分析。

总体设计:

输入:程序自动加载文本位置,文件流输入。

输出:按词频降序输出在控制台。

界面:无界面(控制台)。

数据结构:map,键保存词,值保存出现的次数。

详细设计:

main函数作为程序入口,调用其它函数实现功能。

输入:用BufferedReader带缓冲的输入加速输入,按行(readLine)读入。

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值