正则表达式电子书--正则表达式经典实例.pdf
链接: https://pan.baidu.com/s/1ieWPZt-c1r6NbJvmlWBAdA 提取码: cekk
1、原子
是正则表达式中最基本的组成单位,每个正则表达式至少要包含一个原子,常见的原子类型有:
a、普通字符
import re
string="baidu"
url="www.baidu.com"
result=re.search(string,url)
print(result)
结果:
<_sre.SRE_Match object; span=(4, 9), match='baidu'>
如果没有匹配到目标字符串,会返回None
b、非打印字符
\n 、 \t 、\b等都是非打印字符
c、通用字符
\w 匹配任意字母、数字、下滑线
\W 匹配任意一个(除了字母、数字、下滑线)的字符
\d 匹配任意十进制数
\D 匹配任意一个除了十进制数的字符
\s 匹配空白字符
\S 匹配除了空白字符的任意字符
例:
\w 匹配一个字符或数字或下滑线 \d 匹配一个十进制数
import re
string="\w\dpython\w"
string2="akjasdha12pythonsjkdas"
result=re.search(string