题目
第一次尝试
试着用 Python3 的正则表达式做了一下,发现这题有个坑:
它会出现连续的可拓展序列,例如:
a-b-c \text{a-b-c} a-b-c
但是 Python3 的正则不支持匹配重叠(overlapping)的模式,也就是说在上例中, a-b \text{a-b} a-b 可以被正常匹配,但是 b-c \text{b-c} b-c 就不会被匹配。
改进1
循环匹配并替换多次,直至字符串不再变化。
然而又 WA \color{red}\text{WA} WA 了,因为可能会出现这种情况:
b-a-c \text{b-a-c} b-a-c
由于前面的拓展序列不合法,它不会被替换,于是后面合法的序列永远无法被匹配。
改进2
如果一个可拓展序列不合法,我们先用特殊符号替换它,等整个字符串拓展完了再替换回来。
比如:
b-a-c ⇒ *a-c \text{b-a-c } \color{blue}\Rightarrow \color{black}\text{ *a-c} b-a-c ⇒ *a-c
这样就可以在第二次匹配到 a-c \text{a-c} a-c 了。
然而问题又来了:
b-a-c-a ⇒ *a-*a \text{b-a-c-a }\color{blue}\Rightarrow \color{black}\text{ *a-*a}