WordCount的实现
项目链接:https://gitee.com/hjq-Carry-ode/WordCount
1.项目分析:
本词频统计器包括行数统计、字符数统计、单词数统计、词频统计功能,本词频系统由Java完成。
1.运用到了对字符串的截取split方法,以及IO流对文件读取读写的操作。
2.对Java项目的jre打包,以及利用exe4j来进行exe的转换。
3.所实现的功能为WordCount当中的基本功能。
2.代码实现
getWordsNum(String file) //获取单词数
getCharNum(String file, String saveFileName)//获取字符数,并保存到指定文件夹
getLineNum(String file) //获取行数
savePlace(String fileName)//输出保存地址
获取单词数方法
private static void getWordsNum(String file) { try { //单词计数 int wordCount = 0; //获取文件流 InputStream is = new FileInputStream(file); //读取文件 BufferedReader br = new BufferedReader(new InputStreamReader(is)); //行数不为空,一行一行的读取 String line; while ((line = br.readLine()) != null) { //split方法是将字符串按照某一特定内容来进行划分,划分为数组 String[] str = line.split(" "); wordCount += str.length; } savePlace("result.txt"); System.out.println("字符数为:" + wordCount); } catch (IOException e) { e.printStackTrace(); } }
获取字符数方法
//获取字符的个数 private static void getCharNum(String file, String saveFileName) throws IOException { int charCount = 0; InputStream is = new FileInputStream(file); //读取文件 BufferedReader br = new BufferedReader(new InputStreamReader(is)); int count = 0; //定义line来接受每行的数据 String line; //行数数据不为空,一行一行的读取 while ((line = br.readLine()) != null) { for (int i = 0; i < line.split(" ").length; i++) { count += line.split(" ")[i].length(); } charCount += count; } savePlace(saveFileName); System.out.println("字符数为:" + charCount); }
获取行数方法
//获取行数 private static void getLineNum(String file) throws IOException { int lineCount = 0; InputStream is = new FileInputStream(file); //读取文件 BufferedReader br = new BufferedReader(new InputStreamReader(is)); //行数不为空,一行一行的读取 String line; while ((line = br.readLine()) != null) { //读取行数 lineCount++; } savePlace("result.txt"); System.out.println("行数为:" + lineCount); }
创建文件和保存地址方法
private static void savePlace(String fileName) throws IOException { String path = "C:\\Users\\Personificition\\Desktop\\" + fileName; //没有文件则进行创建 new File(path).createNewFile(); //输出结果地址 PrintStream print = new PrintStream(path); System.setOut(print); }
3.单元测试
用来测试的文本情况
对字符数进行测试,并将结果输出到result.txt
对单词数进行测试,并将结果输出到result.txt
对行数进行测试,并将结果输出到result.txt
可以看到结果是正确的
4.通过git bash将项目上传到码云
创建码云项目
复制码云项目地址
然后打开gitbash,输入
$ git clone https://gitee.com/hjq-Carry-ode/WordCount.git来对地址进行克隆
通过命令 git init 把这个目录变成git可以管理的仓库
可以看到文件里面有个隐藏的.git文件,这是用来版本控制的
但是第一次将文件夹传到了码云上,并不能起作用,所以重新来进行上传,要选好路径,第二次操作语句:
这个时候在码云上就能看到上传成功
5.实验总结
通过这次实验,首先对WordCount有了初步的了解,对字符串的字符数,单词数,行数等的一系列的计算、操作有了明确的认识,并且在网上查阅和浏览资料,也丰富了我对该词频文件更多元深层的了解。
其次,学会了如何对Java进行打包并且转换为exe文件,最后在cmd当中如何运行;这次实验还是让我受益颇多,希望继续努力。
6.参考文献
exe4j转换exe:将IDEAL中的java程序打jar包,并用exe4j转换成exe
Git bash上传码云简易教学:https://www.jianshu.com/p/5323bca00825