正则表达式也就是所说的规则表达式(Regular Expression)正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本.
一 、解释正则表达式中的 g 、i、m
- g : 表示全局(global)模式,也就是说应用于是所有的字符串。并不是说检索到第一个符合的匹配项就结束了
- i :表示字符不区分大小写(case-insensitive),就是检索时字符时不考虑字符的大小写
- m :表示多行(multiline),就是说到达一行的末尾还会继续下一行检索有没有符合规则的匹配项
二、正则表达式中的字符含义:
\f | 表示换页符相当于 \x0c 和 \cL |
---|---|
\n | 换行符,相当于\x0c和\cL |
\r | 回车符,相当于 \x0d 和 \cM |
\s | 匹配任意空白字符,包含空格符、制表符、换页符等,相当于 [\f\n\v\t] |
\S | 匹配任意的非空白字符,相当于[^ \f\n\v\t] |
\t | 表示制表符,相当于\x09 和 \cI |
\v | 表示垂直制表符等价于\x09、cl |
\b | 边界符,匹配单词边界 |
\B | 非单词边界的匹配 |
\w | 匹配字母、数字、下划线。等价于’[A-Za-z0-9_]’ |
\W | 匹配非字母、数字、下划线。等价于’[A-Za-z0-9_]’ |
\0 | 匹配 NULL(U+0000)字符, 不要在这后面跟其它小数,因为 \0 是一个八进制转义序列 |
$ | 匹配字符串的结尾位置,设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ 或 ‘\r’。匹配 $ 字符本身,请使用 转义符即可 \$ |
() | 标记子表达式的开始和结束位置子表达式可以获取以便以后使用 |
* | 表示匹配前面的子表达式零次或者多次,匹配* 使用转义字符 \* |
+ | 表示匹配前面的子表达式一次或者多次,匹配+ 使用转义字符 \+ < |