正则表达式元字符如下:. ^ $ * + ? { } [ ] \ | ( )
. 匹配除换行符以外的所以字符
^ 规定匹配模式必须出现在目标字符串的开头,例如:^hell hello hellboy
$ 规定匹配模式必须出现在目标字符串的结尾,例如:ar$ car bar
* 其前一个字符必须在目标对象中连续出现零次或多次
+ 其前一个字符必须在目标对象中连续出现一次或多次
[0-9] 0-9内任意一个数字,等价于 \d
[a-z] a-z内任意一个小写字母
\ 转义字符
\s 用于匹配单个空格,包括tab键和换行符
\S 用于匹配单个空格之外的所有字符
\d 匹配0-9的数字
\w 匹配字母、数字或下划线
\W 匹配所有和\w不匹配的字符
# -*- coding:utf-8 -*-
import re
var = re.findall('\d+', "abc123pp")
print var
var = re.findall('^H.*', "Hello")
print var
var = re.findall('^H.*', "hello Hello")
print var
var = re.findall('^w+', "www.python.com")
print var
var = re.findall('^w+\.python\.com', "www.python.com")
print var
var = re.findall('^ht+p', "httttp://python.com")
print var
var = re.findall('^ht+p', "www.http.org")
print var
var = re.findall('[ab]', "www.a.org ab a b aa bb") # a b 二选一进行匹配
print var
var = re.findall('^[ ]*#define[ ]+Version[ ]+.*', " #define Version 1.27")
print var
结果:
['123']
['Hello']
[]
['www']
['www.python.com']
['httttp']
[]
['a', 'a', 'b', 'a', 'b', 'a', 'a', 'b', 'b']
[' #define Version 1.27']