正则表达式:
- ‘ . ’ 是通配符,可以匹配除换行符外的任意一个字符。
‘.ython’ == ‘python’、‘jython’ ······
- 用‘【】’括住字符来创建字符集,字符集可以匹配它所包括的任意字符。
'[a-zA-Z0-9]' 能匹配任意大小写字母和数字
- 反转字符集用符号:‘ ^ '
‘[^abc]’ 表示可以匹配除a,b,c外的任意字符
- 选择符:使用管道符号‘ (|) ’
只想匹配字符串'python'和‘perl’ 则 ‘python|perl’
子模式:有时不需要对整个模式进行选择运算符,可使用‘()’括起需要的部分
'p(ython|perl)'
- 可选项:子模式后面加上一个‘ ?’,就变成可选项
r'(http://)?(www\.)?python\.org' ——“ ?”表示子模式可以只出现一次/根本不出现
可以匹配下列字符串:
- 'http://www.python.org'
- 'http://python.org'
- 'www.python.org'
- 'python.org'
- 重复子模式:
- (pattern)* :允许子模式重复 0次或多次
- (pattern)+ :允许子模式重复 1次或多次
- (pattern){m,n} :允许子模式重复m~n次
- 字符串的开始和结尾:
开始:用脱字符(^)表示。
- 比如:只在字符串开头匹配'ht+p',则 '^ht+p'会匹配’http://www.baidu.com',而不会匹配'www.http.com'
结尾,用美元符号($)表示