Java实现java文件英语词汇的统计

最新推荐文章于 2021-05-21 15:35:17 发布

Sirius-X

最新推荐文章于 2021-05-21 15:35:17 发布

阅读量304

点赞数 1

文章标签： java 正则表达式

本文链接：https://blog.csdn.net/weixin_45722772/article/details/113027099

版权

Java实现java文件英语词汇的统计

运用递归来实现多级目录的访问
正则表达式来实现英文的匹配

package cn.ex;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class JavaWordNum {

	static int num = 0;

	public static Map<String, Integer> map = new HashMap<>();

	public static void main(String[] args) throws IOException {

		// 读取目录
		File src = new File("D:\\Java\\eclipse-workspace");
		count(src);

		// 输出hashmap的长度
		System.out.println(map.size());

		// 字符流输出到文件
		StringBuffer sb = new StringBuffer();

		// 遍历hashmap
		for (String s : map.keySet()) {
			if (map.get(s) < 50)
				continue;
			sb.append(s + " ");
			++num;
			System.out.printf("%s;%d\n", s, map.get(s));
		}
		//将hashmap中的数据写入d盘下java.txt文件
		FileWriter fw = new FileWriter("d:/java.txt");
		fw.write(sb.toString());
		fw.close();
		System.out.println(num);

	}

	public static void count(File file) throws IOException {

		// 正则表达式，匹配代码中的英文字母
		Pattern p = Pattern.compile("[a-zA-Z]+");
		if (file.isDirectory()) {
			// 遍历此目录下的文件
			File[] f = file.listFiles();
			for (File fi : f) {
				// 判断文件是否为文件夹，如果是文件夹则运用递归，继续调用此方法
				if (fi.isDirectory()) {
					count(fi);
					// 否则如果文件的名字为.java则进行英文的匹配
				} else if (fi.getName().endsWith(".java")) {
					BufferedReader br = new BufferedReader(new FileReader(fi));
					// 删除空行，逐行操作，存放到hashmap中
					br.lines().forEach(e -> {
						if (e.trim().length() > 0) {
							Matcher m = p.matcher(e);
							while (m.find()) {
								String s = m.group();
								if (map.containsKey(s)) {
									map.put(s, map.get(s) + 1);
								} else {
									map.put(s, 1);
								}
							}
						}
					});
					br.close();
				}

			}
			// 原理与上面类似
		} else if (file.getName().endsWith(".java")) {
			BufferedReader br = new BufferedReader(new FileReader(file));
			br.lines().forEach(e -> {
				if (e.trim().length() > 0) {
					Matcher m = p.matcher(e);
					while (m.find()) {
						String s = m.group();
						if (map.containsKey(s)) {
							map.put(s, map.get(s) + 1);
						} else {
							map.put(s, 1);
						}
					}
				}
			});
			br.close();
		}

	}
}

Sirius-X

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Java实现java文件英语词汇的统计

Java实现java文件英语词汇的统计运用递归来实现多级目录的访问正则表达式来实现英文的匹配package cn.ex;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import java.util.HashMap;import java.util.Map;import
复制链接

扫一扫