今天实现了一下利用java进行词频统计,这里和大家分享一下
思路:
1)分别读取统计,每一个文件,每一个单词出现的次数
定义方法readOneFile(String path) 参数是文件路径,返回值是map
①定义一个 缓冲流进行读取
②定义一个容器map<单词,词频>进行存储
③进行读取,计数
2)汇总统计
汇总上一步方法返回的map,得到最终结果
定义方法mergeAllResult(Map<>...maps)参数是可变参数,不指定固定的文件数量
①增强for循环获取每一个map集合
②将每一个map集合中相同的key的value值进行累加
3)运行方法
执行调用上述两个方法
具体代码如下:
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.Set;
public class WordCount {
public static void main(String[] args) throws IOException {
Map<String, Integer> map01 = readOneFile("e:\\wordcountTest\\1.txt");
Map<String, Integer> map02 = readOneFile("e:\\wordcountTest\\2.txt");
Map&