按照需求自己研究了一下能够解析小说中的章节的算法
package parse;
import java.io.FileInputStream;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
public class ChapterParse {
/** 一级匹配表达式 */
private static String[] regexs = {
"第[零一二三四五六七八九十百千]{1,7}[章集回卷篇][::]?.*",
"第\\d{1,7}[章集回卷篇][::]?.*",
"[零一二三四五六七八九十百千]{1,7}.*",
"\\d{1,7}.*",
".* +第[零一二三四五六七八九十百千]{1,7}[章集回卷篇][::]?.*",
".* +第\\d{1,7}[章集回卷篇][::]?.*"
};
/** 二级匹配表达式 */
private static String[] regexs2 = {
"[零一二三四五六七八九十百千]{1,7}",
"[^,。“”…?;—-]{1,10}"
}