上一节中我们讲过了正则表达式的基础语法,举了一个例子,把A列数据各个部门中的门字去掉,当时写的代码中:
Set regx = CreateObject("vbscript.regexp")
With regx
.Global = True
.Pattern = "门"
End With
.Pattern = "门",此表达式中的“门”字就是一个普通字符,如果表达式中只是用普通字符的话,那我们用查找功能完全可以匹配目标字符串,为何还要写代码呢?所以正则表达式中还有另外一种字符,叫做元字符。
比如我们在查找时通常会用通配符“*”表示任意字符,在正则表达式中也有一些固定的字符,他们可以表达某一类型的字符,以实现强大的匹配能力。
下面例举一些常用的元字符:(注意大小写之分)
d 匹配一个数字字符
D 匹配一个非数字字符
w 匹配包括下划线的任何单词字符。[A-Za-z0-9_]
W 匹配任何非单词字符
s 匹配任何空白字符,包括空格、制表符、换页符等等
S 匹配任何非空白字符
b 匹配一个单词边界,也就是指单词和空格间的位置
B 匹配非单词边界
匹配一个换行符
匹配一个回车符
匹配一个制表符
. 匹配除""之外的任何单个字符。
我们通过具体的例子来体会下这些元字符的作用。
案例1:提取字符串