正则表达式入门(一)
一. 普通字符
字母、数字、汉字、下划线以及没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符在匹配一个字符串时,匹配与之相同的一个字符。
比如表达式"a"匹配字符串"酸辣粉abc",匹配结果为"a"。
二. 简单的转义字符
字符 | 说明 |
---|---|
\n | 换行符 |
\t | 制表符 |
\\ | 表示\自己本身 |
\^ , \$ , \. , \{ , \} , \? , \+ , \- , \* | 匹配这些字符本身 |
\n匹配换行符:
三. 标准字符集合
能与多种字符匹配的表达式。
区分大小写,大写是相反的意思。
字符 | 说明 |
---|---|
\d | 任意一个数字,0-9中的任意一个字符 |
\w | 任意一个字母或者数字或下划线,也就是A-Z,a-z,0-9,_中的任意一个字符 |
\s | 包括空格、制表符、换行符等空的字符中的任意一个字符 |
. | 可以匹配任意一个字符(除了换行符) |
[\s\S] | 可以匹配任意一个字符(包括换行符) |
\d:任意一个数字,0-9中的任意一个字符
\w:任意一个字母或者数字或下划线,也就是A-Z,a-z,0-9,_中的任意一个字符
\s:包括空格、制表符、换行符等空的字符中的任意一个字符。
上面有说到大写是相反的意思,所以[\s\S]匹配所有的字符。
.小数点:可以匹配任意一个字符(除了换行符)。下图可以看见,除了换行符之外的所有符号都匹配到了。与上图的[\s\S]的不同之处就是换行符。
自定义字符集合
[ ] 中括号匹配方式,能匹配括号中的任意一个字符
[ab3] 匹配"a"、“b”、“3”
[^ab3] 匹配"a"、“b”、"3"之外的任意字符
[a-j] 匹配"a"-"j"之间的任意字符
[^A-G0-3] 匹配"A"-“G”、0-3之外的任意字符
正则表达式的特殊符号被包括在[ ]中,则失去特殊意义,除了^、-之外
标准字符集合除小数点之外如果被包含与[ ]中,自定义字符集合将包含该集合。
[\d.-+] 将匹配数字、小数点、-、+