题目描述:
有一个文件,包含以一定规则写作的文本,请统计文件中包含的文本数量
规则如下:
- 文本以";"分隔,最后一条可以没有"",但空文本不能算语句,比如"COMMAND A;;"只能算一条语句
注意,无字符/空白字符/制表符都算作"空"文本
- 文本可以跨行,比如下面,是一条文本,而不是三条
COMMAND A
AND
COMMAND B;
- 文本支持字符串,字符串为成对的单引号(')或者成对的双引号("),字符串可能出现用转义字符(\)处理的单双引号(比如"your input is:\"")和转义字符本身,比如 COMMAND A"Say \"hello\"":
- 支持注释,可以出现在字符串之外的任意位置,注释以"--"开头,到换行结束,比如
COMMAND A;-- this is comment
COMMAND--comment
A AND COMMAND B;
注意,字符串内的"--"不是注释
输入描述
文本文件
输出描述
包含的文本数量
输入1:
COMMAND A;
"kgjg--dsss";;
COMMAND
C COMMAND K;-This is a comment
COMMAND D;-Another comment
dgdg
输出1:
5
public class 文本统计分析12 {
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
StringBuffer preDuan = new StringBuffer(); // 记录前一文本后的信息
boolean isDanYinhao = false; // 记录单双引号的情况
boolean isShuangYinhao = false; // 记录单双引号的情况
int res = 0; // 记录文本数量
while (sc.hasNextLine()){
String trim = sc.nextLine().trim();
if (trim.length() == 0){
break;
}
for (int i = 0; i < trim.length(); i++) {
// 当遇到--时 需要判断是否是引号内的情况
if (trim.charAt(i) == '-' && trim.charAt(i+1) == '-'){
if (!isDanYinhao && !isShuangYinhao){
break;
}
}else if (trim.charAt(i) == ';'){
// 当遇到;时 需要判断是否是引号内的情况
if (isDanYinhao || isShuangYinhao){
continue;
}
// 当遇到;时 需要判断是否是;;的情况
if (preDuan.length() != 0){
res++;
preDuan = new StringBuffer();
}
}else if (trim.charAt(i) == '"'){
// 当遇到"时 需要判断是否是转意的情况
if (trim.charAt(i+1) != '\\'){
isShuangYinhao = !isShuangYinhao;
preDuan.append(trim.charAt(i));
}
}else if (trim.charAt(i) == '\''){
// 当遇到'时 需要判断是否是转意的情况
if (trim.charAt(i+1) != '\\'){
isDanYinhao = !isDanYinhao;
preDuan.append(trim.charAt(i));
}
}else {
// 普通字符存储起来
preDuan.append(trim.charAt(i));
}
}
}
// 处理最后没有分号的情况
if (preDuan.length() != 0){
res++;
}
System.out.println(res);
}
}