201621123063叶斓浈 第三周实验报告

1.要求和码云地址

作业要求:https://www.cnblogs.com/happyzm/p/9626779.html
码云项目地址:https://gitee.com/Yelz/PairProject-Java.git

2.psp表格

PSP2.1个人开发流程预估耗费时间(分钟)实际耗费时间(分钟)
Planning计划3040
· Estimate明确需求和其他相关因素,估计每个阶段的时间成本86
Development开发90120
· Analysis需求分析 (包括学习新技术)1016
· Design Spec生成设计文档2535
· Design Review设计复审46
· Coding Standard代码规范33
· Design具体设计1012
· Coding具体编码3650
· Code Review代码复审108
· Test测试(自我测试,修改代码,提交修改)1321
Reporting报告1015
·测试报告32
·计算工作量21
·并提出过程改进计划33

3.解题思路描述

这次作业修复了上次作业中存在的BUG,新增了两个功能
-1.能够对文本文件中的单词的词频进行统计
+2.能够自定义选择输出前几词频的单词
使用Java Swing GUI实现程序
GUI中设计了一些提示来防止程序出错,以下是部分截图:
1123710-20181007203411174-1360216003.png
1123710-20181007203446984-1073207600.png
1123710-20181007203459749-331781093.png
1123710-20181007203513134-607321927.png
1123710-20181007204251533-380940486.png
1123710-20181007213242338-850472217.png

4.实现过程

一相关类的设计

  • FileAdapter类 该类用于文件写入读取的处理
  • Word类 该类用于统计文件字符数,统计单词数,判断是否是单词,统计单词词频,统计词组词频,统计有效行数
  • MainFrame类 主窗体,该类同来选择需要的功能,选择需要统计的文件,接受用户传入的参数如自定义词组长度和自定义输出前几词频单词
  • CountWordFrame类 此窗体用来输出用户所需的结果,在构造函数中使用一个变量来标识是哪类输出(自定义词组长度或自定义输出前几词频单词)
  • Main类 实例化一个主窗体
    二 相关函数设计
    ①FileAdapter类
  • fileToString函数 将文件转为字符串
  • writeToFile函数 将传入的字符串写入文件
    ②Word类
  • getCharNum() 统计文件字符数
  • isWord(String s) 判断是否是单词
  • getSortedWord() 统计单词词频,得到一个根据词频和字典序排序后的List
  • getLengthSortedWord(int len)根据传入的词组长度,返回一个根据词频和字典序排序后的List
  • getLines() 统计有效行数
    ③MainFrame类
  • MainFrame() 构造函数,构造一个窗体,窗体上有多个控件,让用户能选择文件,选择输出的方法
  • actionPerformed() 对按钮进行事件监听,不同的按钮实现不同功能
    ③CountWordFrame类
  • CountWordFrame() 构造函数,根据主窗体传过来的参数选择输出方法,调用Word类中方法获得排序后的单词List并进行选择通过JLabel输出

    5.主要代码说明

    1.getCharNum()函数
public int getCharNum() // 统计文件字符数
    {
        char c;
        for (int i = 0; i < text.length(); i++) {
            c = text.charAt(i);
            if (c >= 32 && c <= 126 || c == '\r' || c == '\n'|| c == '\t') {
                charNum++;
            }
        }
        return charNum;
    }

2.getLengthSortedWord(int len)//根据传入的词组长度返回一个排序后的List

    public List getLengthSortedWord(int len)
    {
        List<Map.Entry<String, Integer>> list = getSortedWord();
        List<Map.Entry<String, Integer>> res = new ArrayList<>();
        for(int i=0;i<list.size();i++)
        {
            if(list.get(i).getKey().length()==len)
                res.add(list.get(i));
        }
        return res;
    }

3.isWord(String s)函数

    public  boolean isWord(String s)//判断是否是单词
    {
        if(s.matches("[a-zA-Z]{4}[a-zA-Z0-9]*"))//利用正则表达式判断是否是单词(以4个英文字母开头,跟上字母数字符号,单词以分隔符分割,不区分大小写)
            return true;
        else
            return false;
    }
    

4.getSortedWord()//返回一个排序好的存放单词和出现次数的List

        public List getSortedWord() // 统计单词词频(单词:以4个英文字母开头,跟上字母数字符号,单词以分隔符分割,不区分大小写。)
    {
        wordMap = new HashMap<String, Integer>();
        String t = text;
    
        String[] words = t.split("\\s+"); // 对字符串进行分词操作
        for (int i = 0; i < words.length; i++) {
                if (isWord(words[i].trim())) { // 如果是单词
                    words[i] = words[i].trim().toLowerCase();//转换为小写
                    if (wordMap.get(words[i]) == null) { // 判断之前Map中是否出现过该字符串
                        wordMap.put(words[i], 1);//没出现过把这个单词作为key放入map,value值设为1
                    } else
                        wordMap.put(words[i], wordMap.get(words[i]) + 1);//出现过value值+1
                }
        }
        
        List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String, Integer>>(wordMap.entrySet());//把map的键值对装入一个list中
        list.sort(new Comparator<Map.Entry<String, Integer>>() {//对list排序
            @Override
            public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {  //重写compare方法,对list中内容进行排序,先按词频后按字典顺序
                if (o1.getValue() == o2.getValue()) {//如果词频相等
                    return o1.getKey().compareTo(o2.getKey());//就按字典序排列
                }
                return o2.getValue() - o1.getValue();//否则直接按词频排列
            }

        });
        
        return list;//返回排列好后的list
    }

5.getLines() 函数

    public int getLines() { // 统计有效行数
        String[] line = text.split("\r\n"); // 将每一行分开放入一个字符串数组
        for (int i = 0; i < line.length; i++) { // 找出无效行,统计有效行
            if (line[i].trim().length() == 0)//trim函数删除字符串的头尾空白符
                continue;
            lines = lines + 1;
        }
        return lines;
    }

6.文件选择片段

    if(e.getSource() == chooseFile)
        {
            try {
                JFileChooser fc = new JFileChooser();
                fc.setDialogTitle("打开txt文件");
                int result = fc.showOpenDialog(this);  // 打开"打开文件"对话框
                // int result = dlg.showSaveDialog(this);  // 打"开保存文件"对话框
                if (result == JFileChooser.APPROVE_OPTION) {
                    file = fc.getSelectedFile();
                }
                if(file!=null)
                {
                    FileAdapter fd = new FileAdapter();
                    String text = fd.FileToString(file);
                    this.fileText=text;
                    if(fileName!=null)
                        jPanel1.remove(1);
                    fileName = new JLabel("已选文件名:"+file.getName());
                    jPanel1.add(fileName,BorderLayout.WEST);
                    this.repaint();
                    this.validate();
                }
            } catch (IOException e1) {
                e1.printStackTrace();
            }
        }

7.输出结果片段

    if(flag ==0)
        {
            sortedWord=wd.getSortedWord();//得到排序后的存放单词和词频键值对的list
            wordNum = sortedWord.size();
            s += "characters:"+ charNum + "<br/>words:" + wordNum + "<br/>lines:" + lines + "<br/>";
            strForFile += "characters:"+ charNum + "\r\nwords:" + wordNum + "\r\nlines:" + lines + "\r\n";
            int cnt = para;
            if(sortedWord.size()>cnt)
            {
                for (int i = 0; i < cnt; i++)//输出词频最高前十单词
                {
                    s +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "<br/>";
                    strForFile +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "\r\n";
                }
            }
            else
            {
                for (int i = 0; i < sortedWord.size(); i++)//输出词频最高的单词
                {
                    s +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "<br/>";
                    strForFile +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "\r\n";
                }
            }
        }
        else
        {
            sortedWord=wd.getLengthSortedWord(para);//得到排序后的存放词组的list
            wordNum = sortedWord.size();
            s = "characters:"+ charNum + "<br/>words:" + wordNum + "<br/>lines:" + lines + "<br/>";
            strForFile += "characters:"+ charNum + "\r\nwords:" + wordNum + "\r\nlines:" + lines + "\r\n";
            for (int i = 0; i < sortedWord.size(); i++)//输出词频最高的词组
            {
                s +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "<br/>";
                strForFile +=  "["+sortedWord.get(i).getKey()+"]:"+sortedWord.get(i).getValue() + "\r\n";
            }
        }
        
        //结果写入result.txt文件
        try {
            FileAdapter fileAdapter = new FileAdapter();
            fileAdapter.WriteToFile(strForFile);
        } catch (IOException e) {
            e.printStackTrace();
        }

6.回归测试

1123710-20181007211512209-1857115570.png

7.效能测试

1123710-20181007215045760-210688789.png
1123710-20181007215056970-1391979165.png
1123710-20181007215109704-523053585.png
1123710-20181007215118845-1492088570.png
1123710-20181007215133559-1447359087.png

8.总结

上次实验测试数据不充足,这次实验修复了好几个上次实验遗留的BUG,程序代码需要大量的测试才能越来越精炼完美。
有了上周的经验,这周的思路比较清晰,没有浪费太多时间,效率明显提高。

转载于:https://www.cnblogs.com/Yelz/p/9751182.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值