正则表达式不只有在Python里面有,基本上所有的语言都会用到。
Re(Regular Expression)用来匹配字符串文本,个人觉得非常好用。
只要记住一些常用的表达式,其他的不懂是时候可以进行查找,毕竟只re只是个工具啦。
1,Python操作示例
在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为re
#coding=utf-8
导入 re 模块
# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串) # 返回的是跨度
In [1]: import re
In [2]: string = "hello world! this is a test."
In [3]: result = re.match('hello',string)
In [4]: result
Out[4]: <_sre.SRE_Match object; span=(0, 5), match='hello'>
# 如果上一步匹配到数据的话,可以使用group方法来提取数据
result.group(x) 表示匹配的第几个数据
In [5]: result.group(0)
Out[5]: 'hello'
re.match是用来进行正则匹配检查的方法,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),否则返回None(注意不是空字符串”“)。
匹配对象Macth Object具有group方法,用来返回字符串的匹配部分。
注意: re.match() 能够匹配出以xxx开头的字符串
2,常用字符匹配
字符 | 功能 |
---|---|
. | 匹配任意1个字符(除了\n) |
[ ] | 匹配[ ]中列举的字符 |
\d | 匹配数字,即0-9 |
\D | 匹配非数字,即不是数字 |
\s | 匹配空白,即 空格,tab键 |
\S | 匹配非空白 |
\w | 匹配单词字符,即a-z、A-Z、0-9、_ |
\W | 匹配非单词字符 |
还有一些其他的,这里只是列举了常用的。
示例1: .
#coding=utf-8
import re
ret = re.match(".","a")
ret.group()
ret = re.match(".","b")
ret.group()
ret = re.match(".","M")
ret.group()
示例2:[ ]
import re
# 如果hello的首字符小写,那么正则表达式需要小写的h
ret = re.match("h",&