与业务分离的递归解析方法

最新推荐文章于 2020-01-07 20:13:04 发布

goodscript_cn

最新推荐文章于 2020-01-07 20:13:04 发布

阅读量147

点赞数

分类专栏：递归解析文档 java io 文章标签： java io callback java基础

java 同时被 3 个专栏收录

11 篇文章 0 订阅

订阅专栏

递归解析文档

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

首先定义一个回调接口：
接口输入参数采用动态参数，方便灵活


import java.io.IOException;

public interface CallBack {
	/**
	 * 接口有意设计成动态参数形式 
	 * 调用更加灵活
	 * @param objs
	 * @throws IOException
	 */
	void execute(Object... objs) throws IOException;
}

实现递归过程
短短的15行代码就完成了文件夹的递归解析过程
整个历遍过程不涉及到任何业务代码、更好的分离业务逻辑和代码逻辑分类


import java.io.File;
import java.io.IOException;

public class FileHandler {

	/**
	 * 递归解析java文件,然后再调用回归函数处理解析过程
	 * 如果是文件夹的是递归解析
	 * 整个历遍过程不涉及到任何业务代码、更好的分离业务逻辑和代码逻辑分类
	 * @param file
	 * @throws IOException
	 */
	public static void parseJavaFile(File file, CallBack callBack) throws IOException {
		File[] listFile = null;
		if (file.isDirectory()) {
			listFile = file.listFiles();
		} else {
			callBack.execute(file);
			return;
		}
		for (File f : listFile) {
			if (f.isDirectory()) {
				parseJavaFile(f, callBack);
			} else {
				callBack.execute(f);
			}
		}
	}
}

测试
在文件夹D:\\htmlParse\\中存放一些包含有中文内容的文件（任何文件）
下面的实例会帮助你解析该文件夹下面的文件，并且把文件内所有的内容进行中文分词打印出来
当你的解析业务发生了变化
你现在需要重新实现parseFile方法



import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.wltea.analyzer.IKSegmentation;
import org.wltea.analyzer.Lexeme;

/**
 * 递归解析文件夹下所有文件
 * 并对文件内容进行中文分词
 * @author admin
 *
 */
public class ParseFileExample {
	private static List<String> list = new ArrayList<String>();
	private static Pattern p = Pattern.compile("[\u4e00-\u9fa5]+?");

	public static void main(String[] args) throws IOException {

		File file = new File("D:\\htmlParse\\");
		//通过回调函数的形式优雅的递归解析文件夹中的文件
		FileHandler.parseJavaFile(file, new CallBack() {
			public void execute(Object... objs) throws IOException {
				parseFile((File) objs[0]);
			}
		});
		System.out.println(list);
	}

	private static void addChar(String chars) {
		if (!list.contains(chars)) {
			list.add(chars);
		}
	}
        /**
	 * 该方法更像是一个业务方法
	 * 如果你解析业务发生了变化，只需要改变这个方法就可以了
	 * @param file
	 */
	public static void parseFile(File file) {

		Reader reader = null;
		try {
			reader = new InputStreamReader(new FileInputStream(file), "UTF-8");
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		} catch (UnsupportedEncodingException e) {
			e.printStackTrace();
		}
		IKSegmentation iks = new IKSegmentation(reader);

		while (true) {
			Lexeme lex = null;
			try {
				lex = iks.next();
				String lexeme = null;
				if (lex != null) {
					lexeme = lex.getLexemeText();
					Matcher m = p.matcher(lexeme);
					if (m.find()) {
						addChar(lexeme);
					}
				}
				if (lex == null)
					return;
			} catch (IOException e) {
				e.printStackTrace();
			}
		}

	}

}