正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
等价正则符号
符号 | 定义 |
---|---|
?、*、+、\d、\w | 都是等价字符 |
? | 等价于匹配长度{0,1} |
* | 等价于匹配长度{0,} |
+ | 等价于匹配长度{1,} |
\d | 等价于[0-9] |
\w | 等价于[A-Za-z_0-9] |
常用运算符与表达式
符号 | 定义 |
---|---|
^ | 开始 |
() | 域段 |
[] | 包含,默认是一个字符长度 |
[^] | 不包含,默认是一个字符长度 |
{n,m} | 匹配长度 |
. | 任何单个字符(.字符点) |
| | 转义 |
$ | 结尾 |
[A-Z] | 26个大写字母 |
[a-z] | 26个小写字母 |
[0-9] | 0 至 9 数字 |
[A-Za-z0-9] | 26个大写字母、26个小写字母、0 至 9 数字 |
, | 分割 |
分割语法
符号 | 定义 |
---|---|
[A,H,T,W] | 包含A或H或T或W字母 |
[a,h,t,w] | 包含a或h或t或w字母 |
[0,3,6,8] | 包含 0 或 3 或 6 或 8 数字 |
理都懂,然并卵?请通过下面几个例子进一步理解:(持续更新中…)
1、如何限制为最大允许99个小时?
urlpatterns = patterns('',
# ...
url(r'^time/plus/\d+/$', hours_ahead),
# ...
)
这里使用“# …”来表示省略了其他可能存在的URL模式定义。
这个URL模式将匹配类似/time/plus/2/、/time/plus/25/,甚至/time/plus/1000000000/的任何URL。更近一步,把它限制在最大允许99个小时,这样就只允许一个或两个数字,正则表达式的语法就是\d{1,2}:
url(r'^time/plus/\d{1,2}/$', hours_ahead),