201671010402 词频统计软件项目报告

需求分析

  • 可以使用Java编程语言,独立完成一个英文文本词频统计的软件开发。
  • 程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
  • 程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。

测试环境

  • 此次项目的测试机为Windows环境。
  • 使用的JDK版本为 jdk8u161。
  • 使用的JRE版本为jre8u161。

基本功能需求

  • 用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数。
  • 统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
  • 本次项目必须包含src文件夹,在src文件夹中必须包含名为Main.java文件,且Main.java中包含 public static void main(String[] args) 方法。
  • 生成的文件使用的是相对路径,生成的 result.txt 文件在项目的根目录下。

设计实现

    在整个项目设计中,Map类是以按键/数值对的形式存储数据,即单词所出现的次数;BufferedReader类的作用是在读取文件时,让单词从文件中读入字符数据并置入缓冲区;SortMap函数用于实现数组的排序,文件的输出,搜索单词的录入,搜索结果的打印等。

测试运行

测试结果如图所示

  • 单词词频数

1614566-20190319200503402-2119729870.png
1614566-20190319200514380-1254539110.png

  • 将结果返回到result.txt 文件中

1614566-20190319200714472-841257018.png

代码展示

  • 读取一个英文文本,并过滤出只含有字母的文本,且去除长度为0的行

1614566-20190319201324263-1313552847.png

  • 单词的词数统计并按值进行排序

1614566-20190319201536819-790426713.png

  • 将统计的结果返回到result.txt文件中

1614566-20190319201736881-266991134.png

总结

   本人以前没有接触过Java项目的设计与实现,所以这次通过做这个Java项目,我才真正进行了实践,在这个期间,我也通过自主查询资料及上网查询视频教程对Java这个编程语言及它的编程环境有了一些初步的认识及了解。在整个项目实现的过程中,代码这一块是最耗时的,也是通过请教身边的学长学姐和一些朋友才将这个项目完成,对我来说也算是比较困难,归集原因还是因为编程功底太薄弱了,通过这次实验,我想我应该好好学习编程语言,虚心向他人请教,争取越来越好。

展示PSP

任务内容计划共完成需要的时间(min)实际完成所需要的时间(min)
计划1510
估计这个任务需要多少时间,并规划大致工作步骤2010
开发300600
需求分析(包括学习新技术)120240
生成设计文档4060
设计复审(审核设计文档)2030
代码规范(为目前的开发制定合适的规范)1015
具体设计3050
具体编码200600
代码复审2040
测试(自我测试,修改代码,提交修改)4070
报告4050
测试报告2030
计算工作量1015
事后总结,并提出过程改进计划3050

源代码链接地址为:https://github.com/chenjingjinglove/Chenjing

转载于:https://www.cnblogs.com/chenjing1/p/10557467.html

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 扫一扫,分享海报

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
©️2022 CSDN 皮肤主题:编程工作室 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值