头歌-java-字符串与集合练习-词频统计

最新推荐文章于 2024-06-21 01:02:01 发布

DbillionBUG

最新推荐文章于 2024-06-21 01:02:01 发布

阅读量4.4k

点赞数 11

分类专栏：头歌文章标签： java

本文链接：https://blog.csdn.net/wmy1819985954/article/details/115919653

版权

头歌专栏收录该内容

2 篇文章 2 订阅

订阅专栏

第1关：单词分割

任务描述
相关知识
String.split()拆分字符串
StringTokenizer类拆分字符串
编程要求
测试说明

任务描述

本关任务：将一段英语字符串进行单词分割。

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

用String.split()方法将字符串“aaa|bbb|ccc”以“|”进行拆分，用StringTokenizer类将字符串“This?is?a?test?string”以“?”进行拆分。
测试说明
补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

测试输入：

aaa|bbb|ccc
This?is?a?test?string

预期输出：

aaa
bbb
ccc

This
is
a
test
string

提示:
“|”、“.”、“*”、“+”、“\”等不是有效的模式匹配规则表达式，是转义字符，使用split()方法时必须得加"\"才行。

开始你的任务吧，祝你成功！
答案

//请在此添加实现代码
/********** Begin **********/

        String[] strings = str.split("\\|");
        for (String string : strings) {
            list.add(string);
        }

/********** End **********/

	//请在此添加实现代码
/********** Begin **********/
       StringTokenizer strings = new StringTokenizer(str, "?");
        while (strings.hasMoreTokens()) {
            list.add(strings.nextToken());
        }
/********** End **********/

第2关：确定单词在字符串中的位置

任务描述

相关知识
String.indexOf(String str)
String.indexOf(String str, int fromIndex)
编程要求
测试说明
任务描述
本关任务：得到一个单词在一段字符串中的位置。

相关知识
为了完成本关任务，你需要掌握：如何获取字符串中指定单词出现的下标

String.indexOf(String str)
返回指定子字符串在此字符串中第一次出现处的索引。（若返回-1则表示在该字符串中没有你要找的单词）

//声明一段字符串
String str="Can I help you";
//显示“I”在str中第一次出现的下标
System.out.println(str.indexOf("I"));
//String.indexOf(int ch)方法与此方法形同，只是参数是单个字符的ASCII码

输出：
4

String.indexOf(String str, int fromIndex)
返回指定子字符串在此字符串中第一次出现处的索引，从指定的索引开始。

String str="Can I help you";
System.out.println(str.indexOf("I",5));
//同样String.indexOf(int ch, int fromIndex)方法与此方法也形同，只是参数是单个字符的ASCII码

输出：
-1

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

列出给定字符串中每个单词(按“ ”，“,”，“?”，“.”，“!”，“:”，“\n”分割)首次出现的位置。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

测试输入：

No arguments will give courage to the coward.
预期输出：
单词：the---首次出现的角标34
单词：No---首次出现的角标0
单词：give---首次出现的角标18
单词：will---首次出现的角标13
单词：arguments---首次出现的角标3
单词：to---首次出现的角标31
单词：coward---首次出现的角标38
单词：courage---首次出现的角标23

提示：

//1.分割单词时可一次进行
//2.可以采用Map集合的键值对存储
Map<String, Integer> map = new HashMap<String, Integer>();
map.put("Hello",0);
map.put("world",1);
Set<Entry<String, Integer>> entrySet = wordCount.entrySet();
for (Entry<String, Integer> entry : entrySet) {
        System.out.println(entry.getKey()+"---"+entry.getValue());
}

输出：

Hello---0
world---1

开始你的任务吧，祝你成功！

答案

//请在此添加实现代码
/********** Begin **********/
        StringTokenizer strings = new StringTokenizer(str, "  ,?.!:\n");
        while (strings.hasMoreTokens())
        {
           String s=strings.nextToken();
           int value=str.indexOf(s);
           map.put(s,value);
        }
/********** End **********/

第3关：实现词频统计和排序输出

任务描述

本关任务：编写一个能计算一段文本内容中出现单词的次数的降序排列的小程序。

如何进行排序

使用Collections包装类。它包含有各种有关集合操作的静态多态方法。

//可根据指定比较器产生的顺序对指定列表进行排序。
Collections.sort(List<T> list, Comparator<? super T> c)

示例如下：

//以上实例中的map集合为例   将map集合的每一项添加进list集合中
List<Map.Entry<String, Integer>> infos = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());
Collections.sort(infos, new Comparator<Map.Entry<String, Integer>>() {
    public int compare(Map.Entry<String, Integer> o1,
        Map.Entry<String, Integer> o2) {
        //前者-后者  升序         后者-前者  降序
        return (o2.getValue() - o1.getValue());
    }
});

输出：

Day-2
by-1

编程要求

请仔细阅读右侧代码，根据方法内的提示，在Begin - End区域内进行代码补充，具体任务如下：

将指定文本(可以通过右侧文件目录下的src/step3/readme.txt查看)以降序的方式输出每个单词出现的次数。

测试说明

补充完代码后，点击测评，平台会对你编写的代码进行测试，当你的结果与预期输出一致时，即为通过。

预期输出：

参考右边测试集中的输出。

开始你的任务吧，祝你成功！

答案

//请在此添加实现代码
/********** Begin **********/
      StringTokenizer stn = new StringTokenizer(str, " ;’,?.!:\n");

        while (stn.hasMoreTokens()) {
            String str1 = stn.nextToken();
            if (map.containsKey(str1)) {
                map.put(str1, map.get(str1) + 1);
            } else {
                map.put(str1, 1);
            }
        }

/********** End **********/