正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
-
^ 为匹配输入字符串的开始位置,当该符号在中括号表达式中使用时,表示不匹配该方括号表达式中的字符集合。
-
[0-9]+匹配多个数字, [0-9] 匹配单个数字,+ 匹配一个或者多个。
-
abc$匹配字母 abc 并以 abc 结尾,$ 为匹配输入字符串的结束位置。
-
多种匹配模式
-
实例 描述 [Pp]ython
匹配 “Python” 或 “python”。 rub[ye]
匹配 “ruby” 或 “rube”。 [abcdef]
匹配中括号内的任意一个字母。 [0-9]
匹配任何数字。类似于 [0123456789]。 [a-z]
匹配任何小写字母。 [A-Z]
匹配任何大写字母。 [a-zA-Z0-9]
匹配任何字母及数字。 [^au]
除了au字母以外的所有字符。 [^0-9]
匹配除了数字外的字符。 快捷方式
-
实例 描述 .
匹配除 “\n” 之外的任何单个字符。要匹配包括 ‘\n’ 在内的任何字符,请使用象 ‘[.\n]’ 的模式。 ?
匹配一个字符零次或一次,另一个作用是非贪婪模式 +
匹配1次或多次 *
匹配0次或多次 \b
匹配一个长度为 0
的子串\d
匹配一个数字字符。等价于 [0-9]。 \D
匹配一个非数字字符。等价于 [^0-9]。 \s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 \S
匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \w
匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。 \W
匹配任何非单词字符。等价于 ‘[^A-Za-z0-9_]‘。