最近有个网友提问,下面的代码中并没有指定正则表达式的匹配模式(Pattern属性),为什么也可以执行,正则对象根据什么规则去进行匹配。
示例代码如下。
Sub Demo()
Dim strText As String
Dim strNew As String
Dim varText
Dim objRegExp As Object
Set objRegExp = CreateObject("VBSCRIPT.REGEXP")
With objRegExp
.Global = True
End With
strText = "ABCDEFGH"
strNew = objRegExp.Replace(strText, " ")
varText = Split(Trim(strNew))
Stop
Set objRegExp = Nothing
End Sub
运行代码,本地窗口如下所示。strText为需要处理的字符串,共有有8个字符,经过正则替换,结果保存在变量strNew中,不难看出首位各有一个空格,并且每个字符之间也插入了一个空格。这是如何实现的呢?
正则对象不指定匹配模式时,相当于Pattern = ""
,此时匹配字符串中的每一个位置(零宽),注意不是每个字符。例如对于字符串ABCD,包含4个字符,这个非常容易理解,但是其中包含5个位置(下箭头所示),如下图所示。黄色标记为字符串的开始和结束标记。
知道了匹配位置(零宽)和匹配字符的区别,就不难理解为什么正则替换的结果包含前导空格和尾随空格。
第12行代码使用Split
函数将正则替换结果拆分为数组。
字符串转换为单字符数组有多种实现方式,本文只是其中的一种正则应用而已。