201671010401包稚潼 实验二 词频统计软件项目报告

  • 需求分析

    (1)程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
    (2)程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
  • 可行性分析

    (1)操作可行性:系统的操作方式能否在用户组织内行得通,词频统计所需要的资源有限。
    (2)经济可行性:从经济角度考虑,规划方案的实现性和开发的价值,本次是一个作业,不存在经济问题。
    (3)技术可行性:要考虑采用的硬件和软件能否满足用户需求。
  • 基本功能

    (1)指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
    (2)高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
    (3)统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
  • 环境需求

    1.测试机环境:Windows环境
    2.JDK版本:jdk8u161
    3.JRE版本:jre8u161
  • 功能设计

    1.新建文本文件data.txt并且统计各个单词出现的次数
    2.如果次数相同,安装单词的字典顺序排序,输出单词个数
    3.输入要查询的单词,显示它出现的次数 ,用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。.统计该文本所有单词数量及词频数
    4.输出结果并将其存储到result.txt文件中
  • 设计实现

    此软件有两个类:(1)WordCount.java主要实现文件的读入和选择对应的功能。根据用户输入的选择调用对应的方法。
    (2)方法在Tongji.java中,oneWord(取一个单词的频率),gaopin(根据用户输入的k值取高频词),out(将单词和词频数按字典顺序输入到result.txt文件)
    测试运行
  • 程序的运行截图如下图:
    • 单词个数统计:
      1614533-20190319200149330-1308258579.jpg
    • 词频统计:
      1614533-20190319200120702-581550361.jpg

代码片段

输入英文文本
1614533-20190320002729519-785367280.png
排序
1614533-20190320003002746-1366740824.png

  • 展示PSP

    任务内容计划共完成需要的时间(min)实际完成需要的时间(min)
    计划109.5
    估计这个任务需要多少时间,并规划大致工作步骤1620
    开发200230
    需求分析 (包括学习新技术)1210
    生成设计文档1215
    设计复审 (和同事审核设计文档)1012
    代码规范 (为目前的开发制定合适的规范)1012
    具体设计4245
    具体编码120130
    代码复审1512
    测试(自我测试,修改代码,提交修改)3040
    报告1515
    测试报告66
    计算工作量53
    事后总结 ,并提出过程改进计划64
    总结 本次项目对于java小白来说非常具有挑战了,在同学帮助下完成的不容易,大多数要求也未实现,在以后的学习中会更加努力的。编辑过程中问题很多,需要继续努力。
    源码展示.

转载于:https://www.cnblogs.com/aaabaoo/p/10559476.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值