1、常见正则表达式元字符及其作用
元字符 | 作用 |
---|---|
String | 匹配包含 ‘string’ 的字符串 |
| | 如a | b,匹配正则表达式的a或b |
^ | 匹配以……开头的字符串 |
$ | 匹配以……结尾的字符串 |
. | 匹配除\n之外任意字符 |
* | 匹配0次或多次前文正则表达式 |
+ | 匹配1次或多次 |
? | 匹配0次或1次 |
(…) | 匹配括号内的正则表达式并另存为子组(将括号作为一个整体) |
[…] | 匹配包含方括号中字符集任一字符的字符串(如[abc],也可写成[a-c]) |
{ } | 匹配字符长度(如{1,3},长度最小为1,最大为3 |
\d | 匹配十进制数字 |
\w | 匹配字母或数字 |
\s | 匹配空格字符\n, \t, \r, \v, \f 等 |
2、字符串开通b,u,r的含义
① b开头代表二进制
u1=b’\xe6\xb1\x89′
u11=u1.decode(‘utf-8’)
print(u11)
输出:汉
② u开头代表万国码
③ r开头代表不转义
s=r’\tt’
print(s)
结果:‘\tt’
s=’\tt’
print(s)
结果: t