基于Java对WordCount实现

WordCount的实现

项目链接https://gitee.com/hjq-Carry-ode/WordCount

1.项目分析:

本词频统计器包括行数统计、字符数统计、单词数统计、词频统计功能,本词频系统由Java完成。

1.运用到了对字符串的截取split方法,以及IO流对文件读取读写的操作。

2.对Java项目的jre打包,以及利用exe4j来进行exe的转换。

3.所实现的功能为WordCount当中的基本功能。

2.代码实现

getWordsNum(String file) //获取单词数

getCharNum(String file, String saveFileName)//获取字符数,并保存到指定文件夹

getLineNum(String file) //获取行数

savePlace(String fileName)//输出保存地址

获取单词数方法

 private static void getWordsNum(String file) {
        try {
            //单词计数
            int wordCount = 0;
            //获取文件流
            InputStream is = new FileInputStream(file);
            //读取文件
            BufferedReader br = new BufferedReader(new InputStreamReader(is));
            //行数不为空,一行一行的读取
            String line;
            while ((line = br.readLine()) != null) {
                //split方法是将字符串按照某一特定内容来进行划分,划分为数组
                String[] str = line.split(" ");
                wordCount += str.length;
            }
            savePlace("result.txt");
            System.out.println("字符数为:" + wordCount);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

获取字符数方法

 //获取字符的个数
    private static void getCharNum(String file, String saveFileName) throws IOException {
        int charCount = 0;
        InputStream is = new FileInputStream(file);
        //读取文件
        BufferedReader br = new BufferedReader(new InputStreamReader(is));
        int count = 0;
        //定义line来接受每行的数据
        String line;
        //行数数据不为空,一行一行的读取
        while ((line = br.readLine()) != null) {
            for (int i = 0; i < line.split(" ").length; i++) {
                count += line.split(" ")[i].length();
            }
            charCount += count;
        }
        savePlace(saveFileName);
        System.out.println("字符数为:" + charCount);
    }

获取行数方法

 //获取行数
    private static void getLineNum(String file) throws IOException {
        int lineCount = 0;
        InputStream is = new FileInputStream(file);
        //读取文件
        BufferedReader br = new BufferedReader(new InputStreamReader(is));
        //行数不为空,一行一行的读取
        String line;
        while ((line = br.readLine()) != null) {
            //读取行数
            lineCount++;
        }
        savePlace("result.txt");
        System.out.println("行数为:" + lineCount);
    }

创建文件和保存地址方法

private static void savePlace(String fileName) throws IOException {
        String path = "C:\\Users\\Personificition\\Desktop\\" + fileName;
        //没有文件则进行创建
        new File(path).createNewFile();
        //输出结果地址
        PrintStream print = new PrintStream(path);
        System.setOut(print);
    }

3.单元测试

用来测试的文本情况

 

对字符数进行测试,并将结果输出到result.txt

 

对单词数进行测试,并将结果输出到result.txt

 对行数进行测试,并将结果输出到result.txt

 可以看到结果是正确的

4.通过git bash将项目上传到码云

创建码云项目

复制码云项目地址

然后打开gitbash,输入

$ git clone https://gitee.com/hjq-Carry-ode/WordCount.git来对地址进行克隆

 通过命令 git init 把这个目录变成git可以管理的仓库

 

可以看到文件里面有个隐藏的.git文件,这是用来版本控制的

但是第一次将文件夹传到了码云上,并不能起作用,所以重新来进行上传,要选好路径,第二次操作语句:

这个时候在码云上就能看到上传成功

 5.实验总结

通过这次实验,首先对WordCount有了初步的了解,对字符串的字符数,单词数,行数等的一系列的计算、操作有了明确的认识,并且在网上查阅和浏览资料,也丰富了我对该词频文件更多元深层的了解。

其次,学会了如何对Java进行打包并且转换为exe文件,最后在cmd当中如何运行;这次实验还是让我受益颇多,希望继续努力。

6.参考文献

exe4j转换exe:将IDEAL中的java程序打jar包,并用exe4j转换成exe

Git bash上传码云简易教学:https://www.jianshu.com/p/5323bca00825

转载于:https://www.cnblogs.com/hcode/p/9695821.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值