java实验6 词频统计_Java——词频统计（实训一）

最新推荐文章于 2023-01-07 11:23:14 发布

吴厝坑

最新推荐文章于 2023-01-07 11:23:14 发布

阅读量572

点赞数

文章标签： java实验6 词频统计

本文链接：https://blog.csdn.net/weixin_36452379/article/details/114707294

版权

实验小组：张志贤，李鑫ღ( ´･ᴗ･` )比心

实验背景：

本次实验，是由小组内两人完成。按照要求，和一个伙伴坐在一起，并肩作战，面对着同一台显示器，使用着同一键盘，同一个鼠标，一起思考，一起分析，一起编程，一起做博客园，写结束语，并肩地、平等地、互补地完成作业。

试验功能：

1. 小文件输入，从控制台由用户输入到文件中，再对文件进行统计；

2.支持命令行输入英文作品；

3.支持命令行输入存储有英文作品文件的目录名，批量统计；

4.从控制台读入英文单篇作品，重定向输入流。

实现步骤：

1.判断输入方式，如果从命令行传递参数(精美英语短文)则直接对文件进行统计；如果未传递参数，则支持传入文件路径，并且对其目录中的文件进行统计。

2.修改，使其能够按词频降序排列的同时，对同频率的单词进行降序排列。

3. 解决了报错的问题，由于操作的一些小失误，我们决定在总体思路决定后，在进一步纠错，加以改正，最后整理一下输出页面，保证看上去简洁大方。

代码片段：

importjava.io.BufferedReader;importjava.io.File;importjava.io.FileNotFoundException;importjava.io.FileReader;importjava.io.IOException;importjava.io.InputStreamReader;importjava.util.ArrayList;importjava.util.Collections;importjava.util.Comparator;importjava.util.List;importjava.util.Map;importjava.util.Map.Entry;importjava.util.TreeMap;importjava.util.Scanner;/***

*@authorcute

* 实现从文件中读入英文文章，统计单词个数,并按值从大到小输出*/

public classwf {public static voidmain(String[] args) {//主程序逻辑入口

while (true) {

System.out.println("本程序有三种模式：1.单行语言处理；2.单个文件处理；3.批量处理;0.退出程序\n请键入1 2 3选择您需要的模式，模式2指定具体路径为d盘根目录");

Scanner readerScanner= newScanner(System.in);int flag =readerScanner.nextInt();if (flag == 0) {break;

}else if (flag == 1) {try{

System.out.println("当前为当行语言处理模式，请输入您要评测的语句");

BufferedReader bf=new BufferedReader(new InputStreamReader(System.in)); //读取命令行中一行

String s=bf.readLine();

LineCode(s);

}catch(IOException ex) {

System.out.println("请按单行输入句子");

}

}else if (flag == 2) {

System.out.println("当前为单个文件处理模式，请输入您要输入的文件名，格式：aaa.txt");

String s=readerScanner.next();try{

TxtCode(s);

}catch(Exception ex) {

System.out.println("请输入正确的文件名称，确定后文件存在以及文件是否放在d:根目录下");

}

}else if(flag==3){

System.out.println("当前为批量文件处理模式,请输入文件具体路径，格式：d:/ljr");

String path=readerScanner.next();

File file=newFile(path);if(file.isDirectory()) {

File[] filelist=file.listFiles();for(File file1:filelist){try{

String s=file1.getPath();//地址回溯

System.out.println(s);

FileCode(s);

}catch(Exception ex) {

System.out.println("请输入正确的路径，若程序无法结束请重新运行程序");

}

System.out.println("程序结束");

}//统计单个文件

public static void TxtCode(String txtname) throwsException {

BufferedReader br= new BufferedReader(new FileReader("F:/javaxxd/word.txt"));

List lists = new ArrayList(); //存储过滤后单词的列表

String readLine = null;while ((readLine = br.readLine()) != null) {

String[] wordsArr1= readLine.split("[^a-zA-Z]"); //过滤出只含有字母的

for(String word : wordsArr1) {if (word.length() != 0) { //去除长度为0的行

lists.add(word);

}

br.close();

StatisticalCode(lists);

}//统计单行

public static voidLineCode(String args) {

List lists = new ArrayList(); //存储过滤后单词的列表

String[] wordsArr1 = args.split("[^a-zA-Z]"); //过滤出只含有字母的

for(String word : wordsArr1) {if (word.length() != 0) { //去除长度为0的行

lists.add(word);

}

StatisticalCode(lists);

}public static void FileCode(String args) throwsFileNotFoundException, IOException {

BufferedReader br= new BufferedReader(newFileReader(args));

List lists = new ArrayList(); //存储过滤后单词的列表

String readLine = null;while ((readLine = br.readLine()) != null) {

String[] wordsArr1= readLine.split("[^a-zA-Z]"); //过滤出只含有字母的

for(String word : wordsArr1) {if (word.length() != 0) { //去除长度为0的行

lists.add(word);

}

br.close();

StatisticalCode(lists);

}public static void StatisticalCode(Listlists) {//统计排序

Map wordsCount = new TreeMap(); //存储单词计数信息，key值为单词，value为单词数//单词的词频统计

for(String li : lists) {if (wordsCount.get(li) != null) {

wordsCount.put(li, wordsCount.get(li)+ 1);

}else{

wordsCount.put(li,1);

}

}//System.out.println("wordcount.Wordcount.main()");

SortMap(wordsCount); //按值进行排序

}//按value的大小进行排序

public static void SortMap(Mapoldmap) {

ArrayList> list = new ArrayList>(oldmap.entrySet());

Collections.sort(list,new Comparator>() {public int compare(Entry o1, Entryo2) {return o2.getValue() - o1.getValue(); //降序

}

});for (int i = 0; i < list.size(); i++) {

System.out.println("文中出现的单词："+list.get(i).getKey() + "\t " +"出现次数："list.get(i).getValue());

}

运行结果：功能一：

功能二：

实验心得：在结对编程中，任何一段代码都被两双眼睛看过，两个脑袋思考过。代码被不断地复审，重修。结对编程的过程也是一个互相督促的过程，每个一举一动都在小伙伴的视线之内。由于这种督促的压力，使得我们更认真地工作，频繁地交流，提高自己的技术能力。第一次面对这种模式的考核，刚开始有些手足无措，不过慢慢磨合下来，我发现优点要大于缺点。一个简单的例子，我们的代码准确率明显提高，以前练习时浪费在查漏补缺的时间数不胜数，现在，一个人在敲代码的时候，另一个人就是她的督导，错误可以及时被发现，避免许多复查的可能性，其次，我们可以互相敲代码，提倡“间歇式”敲代码，就如大家所知道的，敲代码是一个十分苦恼的事情，不仅累人，而且，纯手工敲代码，不过大脑，不能提高任何能力，现在和小伙伴一起敲代码，变得舒服很多。

实验过程图片：

汉堡包

优点：1、勤奋，善于学习自己感兴趣的知识和事物。

2、做事认真负责。

3、用心务实，敢于主动承担自己的职责。

4、喜欢与人交流，善于组织策划活动。

缺点：1、性格方面的弱点，有时给自己压力过大，急于求成，过犹不及。

2、工作起来，有时会忘记时间。

希望她改正：希望她可以继续保持她的优点。

码云地址 https://gitee.com/lixin-123/practical_training (^_^)

吴厝坑

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java实验6 词频统计_Java——词频统计（实训一）

实验小组：张志贤，李鑫ღ( ´･ᴗ･` )比心实验背景：本次实验，是由小组内两人完成。按照要求，和一个伙伴坐在一起，并肩作战，面对着同一台显示器，使用着同一键盘，同一个鼠标，一起思考，一起分析，一起编程，一起做博客园，写结束语，并肩地、平等地、互补地完成作业。试验功能：1. 小文件输入，从控制台由用户输入到文件中，再对文件进行统计；2.支持命令行输入英文作品；3.支持命令行输入存储有英文作品文件的...
复制链接

扫一扫

java实验6 词频统计_Java——词频统计（实训一）

“相关推荐”对你有帮助么？