正则表达式
1. 限定符
(1) ? 前面字符出现的次数0或1,也就是可有可无
(2) * 匹配0个或多个字符
(3) + 匹配1次或多次,即至少出现1次
(4)花括号限定 , 如 限定出现6次 {6};重复1至6次{1,6} ,重复6次以上{6, }
2. 或运算符
小括号 和 | 运算符 表示或者。如(a |b) 表示字符 a或者b
3. 字符类
方括号 [ ]里的内容代表要求匹配的的字符只能取子于它们.
如 匹配所有小写字母 [a-z] , 匹配所有字母[a-zA-Z], 匹配字母和数字[a-zA-Z0-9]
^ 取反, 排除的字符,[^0-9] 不是数字。
4. 元字符
正则表达式中大多数元字符都以反斜杠开头
\d+ 数字字符
\w+ 单词字符(英文,数字以及下划线)
\s+ 空白符(包含Tab和换行符)
\D+非数字字符
\W 非单词字符
\S+非空白字符
点 . 代表任意字符, .* 表是0个或多个任意字符
^ 匹配行首, $ 匹配行尾,在区间外
\b 单词边界, 如 限制单词 Code,\bCode\b
5. 贪婪与懒惰匹配
贪婪匹配,尽可能多的匹配,全部匹配
加上? 尽可能少的匹配,懒惰匹配。