小伙伴们大家好,今天给大家介绍一个自定义函数,可以用来提取文本中的数字、汉字和字母,话不多说,让我们一起看下效果。
功能讲解
上图中,通过自定义一个函数“tiqu”,它一共有两个参数:
tiqu(字符串,提取类型)
参数一是需要提取的字符串;
参数二是需要提取的类型,1代表提取字母,2代表提取数字,3代表提取汉字。
代码讲解
首先通过一个IF函数,来判断自定义函数参数二的输入情况:
如果参数二输入为1,则正则表达式匹配非字母;
如果参数二输入为2,则正则表达式匹配非数字;
如果参数二输入为3,则正则表达式匹配非汉字;
变量a存储匹配模式。
在确定参数二之后,建立正则表达式,并将上面的a赋值给匹配模式,接着将输入的参数一中的内容,符合正则表达式的部分全部替换为空;
这样,如果参数二输入的为1,匹配到的非字母全部被替换为空,最终自会留下字母,依次类推。
小结
正则表达式的方便之处在于,可以灵活提取想要的字符组合,不局限于字符串是否规则,熟练掌握,是一款强大的字符串处理工具。
到这里,有没有对Python感兴趣的小伙伴呢?为此,UP主整理了如下内容无偿获取方式:
1.点赞+评论(勾选同时转发)
2.关注UP主。并私信回复关键字【Python】(一定要私信哦,点击我的头像就能看到私信按钮了。)