小伙伴们大家好,今天给大家介绍一个自定义函数,可以用来提取文本中的数字、汉字和字母,话不多说,让我们一起看下效果。
功能讲解
上图中,通过自定义一个函数“tiqu”,它一共有两个参数:
tiqu(字符串,提取类型)
参数一是需要提取的字符串;
参数二是需要提取的类型,1代表提取字母,2代表提取数字,3代表提取汉字。
代码讲解
首先通过一个IF函数,来判断自定义函数参数二的输入情况:
如果参数二输入为1,则正则表达式匹配非字母;
如果参数二输入为2,则正则表达式匹配非数字;
如果参数二输入为3,则正则表达式匹配非汉字;
变量a存储匹配模式。
、
确定参数二之后,建立正则表达式,并将上面的a赋值给匹配模式,接着将输入的参数一中的内容,符合正则表达式的部分全部替换为空;
这样,如果参数二输入的为1,匹配到的非字母全部被替换为空,最终会留下字母,依次类推。
完整代码如下所示:
Function tiqu(str As String, i As Integer) If i = 1 Then a = "[^A-Za-z]" ElseIf i = 2 Then a = "[^0-9]" ElseIf i = 3 Then a = "[^\u4e00-\u9fa5]" End If Set regEx = CreateObject("VBScript.RegExp") With regEx .Global = True .Pattern = a tiqu = .Replace(str, "") End WithEnd Function
小结
正则表达式的方便之处在于,可以灵活提取想要的字符组合,不局限于字符串是否规则,熟练掌握,是一款强大的字符串处理工具。