针对单词文本文件,统计每个单词出现的次数
- 思路:读取文件,通过才分得到单词列表,定义一个哈希映射保存词频统计结果,遍历列表,如果第一次遇到某个单词,就在哈希映射里添加一个元素,单词为键,1为值;如果不是第一次遇到,那么在哈希映射里找到该键,将其值加1。
一、编程实现
- 创建一个单词文本文件-
words.txt
- 在
net.zwh.p03
里创建t08
子包,在子包里创建WordCount
类
- 读取文件所有行
- 将文件行按空格拆分成单词数组
- 针对每行的单词数组进行词频统计
- 查看完整代码
package net.zwh.p03.t08;
import java.io.BufferedReader;
import java.io.FileReader;
import java.util.HashMap;
import java.util.Map;
public class WordCount {
public static void main(String[] args) throws Exception {
//定义缓冲字符输入流
BufferedReader br = new BufferedReader(new FileReader("words.txt"));
//定义词频统计哈希映射
Map<String, Integer> wc = new HashMap<>();
// 定义行字符串变量
String nextline = "";
// 读取文件,遍历所有行
while ((nextline = br.readLine()) != null) {
// 按空格拆分,得到单词数组
String[] words = nextline.split(" ");
// 遍历单词数组
for (String word:words) {
wc.put(word, wc.containsKey(word)? wc.get(word)+1 : 1);
}
}
for (String key:wc.keySet())
System.out.println("[" + key + " : " + wc.get(key) + "]");
}
}
二、知识点
1、哈希映射
- put(key, value) - 田间元素(键值对)
- get(key) - (按键取值)
- containsKey(key) - 是否包含某个键
- keySet() - 键集合
- values() - 值集合
2、哈希集合
- add() - 添加元素
- move() - 移除元素
- size() - 集合元素个数
- isEmpty() - 是否为空集