个人项目:Java实现WC

Java实现WC

Github项目地址:https://github.com/auxshaw/WC

项目要求

wc.exe 是一个常见的工具,它能统计文本文件的字符数、单词数和行数。这个项目要求写一个命令行程序,模仿已有wc.exe 的功能,并加以扩充,给出某程序设计语言源文件的字符数、单词数和行数。实现一个统计程序,它能正确统计程序文件中的字符数、单词数、行数,以及还具备其他扩展功能,并能够快速地处理多个文件。

-基本功能列表:
wc.exe -c file.c //返回文件 file.c 的字符数(实现)
wc.exe -w file.c //返回文件 file.c 的词的数目 (实现)
wc.exe -l file.c //返回文件 file.c 的行数(实现)
-扩展功能:
s 递归处理目录下符合条件的文件。(未实现)
a 返回更复杂的数据(代码行 / 空行 / 注释行)(实现)
-高级功能:
-x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。(未实现)
需求举例:
 wc.exe -s -a .c
返回当前目录及子目录中所有
.c 文件的代码行数、空行数、注释行数。

PSP

PSP2.1Personal Software Process Stages预估耗时(分钟)实际耗时(分钟)
Planning计划3060
· Estimate· 估计这个任务需要多少时间3060
Development开发8801420
· Analysis· 需求分析 (包括学习新技术)90150
· Design Spec· 生成设计文档4060
· Design Review· 设计复审 (和同事审核设计文档)3060
· Coding Standard· 代码规范 (为目前的开发制定合适的规范)3060
· Design· 具体设计4090
· Coding· 具体编码500900
· Code Review· 代码复审6040
· Test· 测试(自我测试,修改代码,提交修改)9060
Reporting报告100100
· Test Report· 测试报告6060
· Size Measurement· 计算工作量1010
· Postmortem & Process Improvement Plan· 事后总结, 并提出过程改进计划3030
合计10101580

解题思路

本次项目要对文本文件的字符数,单词数和行数等进行统计,这可以使用Java中的字节流读取文件,字符流进行字符数的统计。之后,我用Pattern类和Matcher类进行模式匹配,使用正则表达式分辨出字符,单词,空行,注释行和代码行,用BufferedReader类中的readLine()统计行数。在实现功能时,统计字符数和行数比较简单,统计单词数就要麻烦许多,单词定义比较模糊,所以要对单词进行精确定义。我对单词的定义是:字母和数字组合在一起,中间没有空格则是一个英文单词,一个汉字则是一个词。最后,要统计空行数,注释行数和代码行数,空白行:整行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。注释行:存在//、/* /、/、*/的算作注释行。代码行:除了空白行和注释行之外的都是代码行。

设计实现

本次项目写了三个类,一个是运行程序的WC类,一个是检查命令和传递文件路径的Create类,最后是存放统计方法的Count类。
其中main()用Scanner类来接收命令的输入,并将命令传到create()里,用create()检查命令是否正确,同时匹配相应的命令调用相应的方法,并将文件路径传过去。在create()里,用Pattren类和Matcher类进行匹配,检查命令是否错误,用switch进行功能选择,调用Count类的方法。关系图如下:
1483675-20180914174604409-74149763.png

代码说明

create()

检查命令是否正确,传递文件路径,匹配命令,调用方法

public void create(String command) throws IOException{      
        Count count=new Count();
        //检查命令是否正确
        Pattern Pa = Pattern.compile("^(\\-[cwla]\\s+){1,4}\\s*+\\S+$");
        Matcher Ma = Pa.matcher(command);  
        if(!Ma.matches()) {
            System.out.println("指令错误,请重新输入");           
        }  
        //文件路径
        int index = command.lastIndexOf(" ");
        String path = command.substring(index +1);
        //匹配命令
        Pattern pattern = Pattern.compile("\\-[cwla]");
        Matcher Match = pattern.matcher(command);     
        while(Match.find()) {
        switch (Match.group().replace("-", "")) {
            case "c":
                count.countchar(path);
                break;                  
            case "w":
                count.countword(path);
                break;
            case "l":
                count.countline(path);
                break;
            case "a":
                count.countline3(path);
                break;   
        }          
    }          
    }
countchar()

统计字符数,匹配非空白字符即可对显示的字符计数

//统计字符数
public void countchar(String path) throws IOException{ 
        String str=null;
        int countchar1=0;
        BufferedReader br=new BufferedReader(new FileReader(path)); 
        while((str=br.readLine())!=null){           
            Pattern p = Pattern.compile("\\S");
            Matcher m = p.matcher(str);
            while(m.find()) {
            countchar1++;}
        }                   
        System.out.println("字符数:"+countchar1);
        br.close();
    }
countline()

统计行数,使用readLine()可以很容易得出行数

//统计行数
    public void countline(String path) throws IOException{ 
        String str=null;
        int countline1=0;           
        BufferedReader br=new BufferedReader(new FileReader(path));
        while((str=br.readLine())!=null){
            countline1++;
        }
        System.out.println("行数:"+countline1);
        br.close();
    }
countword()

统计单词数,先匹配中文,统计中文词数,再用replaceAll()将非字母数字的字符替换成空格,按空格分割,将字符串存到数组中,则数组大小即为英文单词的数目,最后相加得到单词数

//统计英文单词数
public void countword(String path) throws IOException{ 
        String str=null;
        int countworde=0;
        int countwordc=0;
        int countword=0;    
        StringBuffer sbf = new StringBuffer();
        BufferedReader br=new BufferedReader(new FileReader(path)); 
        while((str=br.readLine())!=null){   
            //统计中文字数
            Pattern pa = Pattern.compile("[\\u4e00-\\u9fa5]");
            Matcher ma = pa.matcher(str);
            while(ma.find()){
                countwordc++;
            }               
            //统计英文单词数
            sbf.append(str);
            String word=sbf.toString().replaceAll("[^a-zA-Z0-9]"," ");
            String[] words=word.split("\\s+");          
            countworde=words.length;                                    
        }
        countword=countwordc+countworde;
        System.out.println("词的数目:"+countword);
        br.close();
    }
countline3()

统计空白行,代码行和注释行各行行数,用正则表达式和if语句去统计空白行,注释行和代码行

//统计空白行,代码行和注释行各行行数
    public void countline3(String path) throws IOException{
        String str=null;
        int spacelines=0;
        int codelines=0;
        int notelines=0;
        String notebegin="\\s*/\\*.*";
        String noteend=".*\\*/\\s*";
        String noteall="[^a-zA-Z0-9]*//.*";
        String regxspace="\\s*\\S?\\s*";
        boolean flag = false;
        BufferedReader br=new BufferedReader(new FileReader(path));      
        while((str=br.readLine())!=null){           
            if (str.matches("\\s*/\\*.*\\*/\\s*")) { 
                notelines++;    
                continue;}
              if (str.matches(notebegin)) {
                  notelines++;flag = true;} 
                else if (str.matches(noteend)) {
                    notelines++; flag = false;}
                  else if(str.matches(regxspace)){
                      spacelines++;}
                    else if (str.matches(noteall)) {
                        notelines++;}    
                      else if (true == flag)
                          notelines++;
                        else codelines++;
            }   
        System.out.println("空白行:"+spacelines);
        System.out.println("注释行:"+notelines);
        System.out.println("代码行:"+codelines);
        br.close();
    }
WC.java

读取输入的命令并将指令传到create()中

package wordcount;
import java.io.*;
import java.util.*;

public class WC {
    
    public static void main(String[] args) throws IOException{      
        Create cr=new Create();
        cr.tips();      
        Scanner scan = new Scanner(System.in);          
        String command=null;
        while(scan.hasNextLine()) {
        //读取控制台的命令          
        if (scan.hasNextLine()) {
            command = scan.nextLine();}    
        cr.create(command);
    }
        scan.close();
    }
    
}

测试运行

文件已打包成wc.exe文件,可直接使用。

测试文件

一个空文件
1483675-20180914164125484-2105258538.png

只有一个字符
1483675-20180914164158449-1930098686.png

只有一个单词
1483675-20180914164222128-392064620.png

只有一行
1483675-20180914164242192-1865547694.png

count.java
1483675-20180914164247894-2017880691.png

代码覆盖率

1483675-20180914164442689-107505588.png

代码覆盖率:91.1%

项目小结

本次项目是第一次规划好设计流程,按部就班地完成。在这次项目中,我使用Java进行编程,复习了I/O流的使用,更加明白正则表达式的魅力所在,用正则表达式去实现本次项目的功能是非常方便的。而在这其中,我还有很多的不足,没有足够的能力去实现高级功能,代码中也有很多地方可以进行优化,我之后还会继续改进。此次也有许多收获,通过本次项目,我掌握了github,git的使用方法,知道了如何进行单元测试,明白了做项目之前做好规划是很有必要的。

转载于:https://www.cnblogs.com/shawaux/p/9645675.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值