软件设计基础实践-Java高级特性-字符串与集合练习之词频统计

数字游牧人

于 2023-09-14 19:08:11 发布

阅读量224

点赞数

文章标签： java python 开发语言

本文链接：https://blog.csdn.net/m0_74077305/article/details/132888733

版权

第1关：单词分割

任务要求
参考答案
评论150

任务描述

本关任务：将一段英语字符串进行单词分割。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

用String.split()方法将字符串“aaa|bbb|ccc”以“|”进行拆分，用StringTokenizer类将字符串“This?is?a?test?string”以“?”进行拆分。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

测试输入： aaa|bbb|ccc This?is?a?test?string 预期输出： aaa bbb ccc

This is a test string

提示: “|”、“.”、“*”、“+”、“\\”等不是有效的模式匹配规则表达式，是转义字符，使用split()方法时必须得加"\\"才行。

开始你的任务吧，祝你成功！

package step1;
import java.util.List;
import java.util.ArrayList;
import java.util.StringTokenizer;
public class StudentDemo{

	//使用String.split()方法分割
	public List<String> splitPartition(String str){
		List<String> list=new ArrayList<String>();
//请在此添加实现代码
/********** Begin **********/
        String[] arr=str.split("\\|");
        /*for(int i=0;i<arr.length;i++){
            String s=arr[i];
            list.add(s);
        }*/
        for(String s:arr){
            list.add(s);
        }
/********** End **********/
		return list;
	}

	//使用StringTokenizer类进行分割
	public List<String> tokenPartition(String str){
		List<String> list=new ArrayList<String>();
	//请在此添加实现代码
/********** Begin **********/
        StringTokenizer st=new StringTokenizer(str);
        while(st.hasMoreTokens()){
            list.add(st.nextToken("?"));
        }
/********** End **********/	
		return list;
	}

}

第2关：确定单词在字符串中的位置

200

任务要求
参考答案
评论150

任务描述

本关任务：得到一个单词在一段字符串中的位置。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

列出给定字符串中每个单词(按“ ”，“,”，“?”，“.”，“!”，“:”，“\n”分割)首次出现的位置。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

测试输入： No arguments will give courage to the coward. 预期输出： 单词：the---首次出现的角标34 单词：No---首次出现的角标0 单词：give---首次出现的角标18 单词：will---首次出现的角标13 单词：arguments---首次出现的角标3 单词：to---首次出现的角标31 单词：coward---首次出现的角标38 单词：courage---首次出现的角标23

提示：

//1.分割单词时可一次进行
//2.可以采用Map集合的键值对存储
Map<String, Integer> map = new HashMap<String, Integer>();
map.put("Hello",0);
map.put("world",1);
Set<Entry<String, Integer>> entrySet = wordCount.entrySet();
for (Entry<String, Integer> entry : entrySet) {
System.out.println(entry.getKey()+"---"+entry.getValue());
}

输出： Hello---0 world---1

开始你的任务吧，祝你成功！

package step2;
import java.util.Map;
import java.util.HashMap;
import java.util.StringTokenizer;
public class StudentDemo{
//返回一个Map集合来得到单词和首次出现的下标  key为单词名称  value为单词的角标
public Map<String, Integer> getMap(String str){
Map<String, Integer> map = new HashMap<String, Integer>();
//对str进行分割   再加入map集合中
//请在此添加实现代码
/********** Begin **********/
	StringTokenizer tok = new StringTokenizer(str);
		String word;
		while(tok.hasMoreTokens()){
			word = tok.nextToken(", .\n");
			int index = str.indexOf(word);
			map.put(word,index);
		}
/********** End **********/
		return map;
	}
}

第3关：实现词频统计和排序输出

500

任务要求
参考答案
评论150

任务描述

本关任务：编写一个能计算一段文本内容中出现单词的次数的降序排列的小程序。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

将指定文本(可以通过右侧文件目录下的src/step3/readme.txt查看)以降序的方式输出每个单词出现的次数。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

预期输出：参考右边测试集中的输出。

开始你的任务吧，祝你成功！

package step3;
import java.util.Map;
import java.util.HashMap;
import java.util.StringTokenizer;
public class StudentDemo{
	//获取单词的数量
	public Map<String, Integer> getWordCount(String str) {
		Map<String, Integer> map = new HashMap<String, Integer>();
		
//请在此添加实现代码
/********** Begin **********/
    StringTokenizer tokenizer=new StringTokenizer(new String (str));
    int count;
    String word;
    while(tokenizer.hasMoreTokens()){
        word=tokenizer.nextToken(" ,?.!:;\"\"‘’\n");
        if(map.containsKey(word)){
            count=map.get(word);
            map.put(word,count+1);
        }else{
            map.put(word,1);
        }
    }
/********** End **********/

		return map;
	}
}

数字游牧人

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
软件设计基础实践-Java高级特性-字符串与集合练习之词频统计

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。本关任务：编写一个能计算一段文本内容中出现单词的次数的降序排列的小程序。返回指定子字符串在此字符串中第一次出现处的索引，从指定的索引开始。请仔细阅读右侧代码，根据方法内的提示，在。请仔细阅读右侧代码，根据方法内的提示，在。
复制链接

扫一扫