正则表达式
result=re.match(正则表达式,要匹配的字符串)
单个字符:
. :匹配除换行(\n)以外的任意字符
\d :数字字符
\D:取反,非数字字符
\w:字符串字符(数字、字母、下划线、汉字)
\W:非字字符
\s:空白字符(\n、\t、\r、空格等)
\S:非空白字符
\b:词边界(开头、结尾、空格、标点)
\B:非词边界
次数限定:(可以重复几次)
{m}:m次
{m,n}:m-n次
{m,}:至少m次
{,m}:至多m词
?:至多一次(0,1)
+:至少一次
*:任意多次(也可为0)
边界限定:
^:以指定的内容开头
$:以制定的内容结尾
|:或
分组匹配:
() >> \num
命名 >> ?P<name>
sub 将匹配到的数据进行替换
sub,'原内容',’替换内容‘,’文本字符串‘
“”“
三引号的用法,保留字符串的原本格式,换行、单引号和双引号不需要再去规范,自动规范
”“”
注释用的也是这个原理,就是字符串,只是没有打印,会影响解析器的运行效率,
#是传统的注释
split
python贪婪和非贪婪
?只有一次