评论中提到了正确的解决方案.您需要实际编写编译器/解析器.从我的编译器课程来看,我的记忆有点模糊,但这就是你如何接近它.
基本概念是将输入转换为标记(这是正则表达式正常的地方).这称为词法分析
所以:
[Config Object]
{Loop 3
Section[i]
{Loop 3
Setting[i] = Value[i]
}
}
OtherSetting=X
成为(伪代码令牌,也许不完全是你需要的)
OPEN_BRACKET STRING(=Config Object) CLOSE_BRACKET
START_LOOP NUMBER(=3)
STRING(=Section) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
START_LOOP NUMBER(=3)
STRING(=Setting) OPEN_BRACKET STRING(=i) CLOSE_BRACKET EQUAL STRING(=Value) OPEN_BRACKET STRING(=i) CLOSE_BRACKET
END_LOOP
END_LOOP
STRING(=OtherSetting) EQUAL STRING(=X)
因此,如果你的词法分析器为你提供了如上所述的一系列标记,你只需要将其解析为实际语法(因此这是你不想使用正则表达式的地方).
你的语法(对于循环)是沿着这些方向的东西(伪代码语法类似于Bison,我可能忘记了部分/故意留下的东西):
INDEXED_CONFIG_LINES: INDEXED_CONFIG_LINE | INDEXED_CONFIG_LINES INDEXED_CONFIG_LINE;
INDEXED_CONFIG_LINE: STRING OPEN_BRACKET STRING CLOSE_BRACKET EQUAL STRING OPEN_BRACKET STRING CLOSE_BRACKET;
LOOP: START_LOOP NUMBER LOOP_BODY END_LOOP;
LOOP_BODY: INDEXED_CONFIG_LINES | LOOP;
因此,您需要一个可以使用该语法来构建语法树的解析器,而不是正则表达式.你基本上只是构建一个状态机,在那里你将下一个令牌转换到某个状态(比如在循环体中等).
老实说,YAML可能会满足您的需求,而不是重新发明轮子或采用正则表达式体操.但是如果你真的需要使用你提出的循环语法,你可以看一下Symfony Yaml组件,看看它们是如何进行解析的. https://github.com/symfony/Yaml