词频统计作业--第一次软工作业

      只是一些简单感想。

      之前没有学过C++和C#,老师上来就这么自主地布置了一个这样的作业确实有点出乎意料。

      之前团队作业要求采访学长,学长的印象是每周要花10h以上在软工,代码均1000行+,这回写第一次作业,让没有基础的我体会到了学长的话。这个作业花了大约15h的时间。其中调试占用了12h。查阅了很多资料,还是觉得一口吃成胖子不是一个现实明智的想法,希望以后能着边际。

使用VS2012自带的代码分析工具,前面的时间是把各个搜索到的子文件的内容写到一个大文件里面(浪费时间),接下来是对这个大文件进行词频统计,也是最耗CPU的地方。

至今有一个很奇葩的bug。调了近5h还是没调出来:

     在控制台下输入文件夹目录A,可以只在输入的目录A下面进行递归地词频统计,最后在目录A下面生成目标文件。
     只将输入目录换成命令行参数读取,就会在目录A的所有子目录a、b、c、d、e、f、g...下面都有目标文件,并只是各自
统计各自文件夹里的词频。没有达到要求。

 测试用例:流传的21M测试用例,和自己用代码增添的一个20M左右的txt文件(即1图),后来发现上面的bug,经过调试之后在控制台输入下解决了问题。使用更为复杂的流传的21M用例后,速度也有了明显的提升。

转载于:https://www.cnblogs.com/muwodashu/p/3337982.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值