实例需求:提取文字中的4位数字年份(19xx或者20xx),文字中包含其他的数字,例如多余4位的:0749345,非年份数字:H-1803F。
示例代码如下。
Sub Demo()
Dim regExp As Object
Dim aRes, arr
Set regExp = CreateObject("vbscript.regExp")
regExp.Global = True
regExp.Pattern = "\D((19|20)\d{2})\D"
txt = [a1].Value
Set objMatch = regExp.Execute(txt)
If objMatch.Count > 0 Then
For Each mat In objMatch
Debug.Print mat.submatches(0)
Next
End If
Set regExp = Nothing
End Sub
【代码解析】
第4行代码创建正则表达式对象。
第5行代码设置全局匹配。
第6行代码设置匹配模式。
第7行代码读取A1单元格的内容。
第9行代码判断是否匹配成功。
第10~12行代码循环处理匹配结果。
第11行代码输出匹配值。
正则表达式 | 说明 |
---|---|
\D | 匹配一个非数字字符 |
`(19 | 20)\d{2}` |
\D | 年份数字之后匹配一个非数字字符 |
通过观察发现年份字符有的在圆括号中,有的在方括号中,有的没有括号,因此不能使用此特征。无论是否有括号,年份前后都分别有一个非数字字符,这是本正则匹配的核心点。
【立即窗口】中的输出结果如下所示。