字符集
前言
本章节主要介绍,正则表达式中有哪些描述字符集的元字符,以及如何使用。
不可见字符
"\f": 表示换页符, 等同于"\x0C"
"\t": 表示制表符, 等同于"\x09"
"\v": 表示垂直制表符, 等同于"\x0B"
"\n": 表示换行符, 等同于"\x0A"
"\r": 表示回车符, 等同于"\x0D"
"\s": 表示空格和上述字符, 等同于"[ \f\t\v\n\r]"
"\S": 表示非上述所有字符, 等同于"[^ \f\t\v\n\r]"
数字字符
"\d": 表示0123456789, 等同于"[0-9]"
"\D": 表示非0123456789, 等同于"[^0-9]"
单词字符
"\w": 表示数字字母下划线和Unicode字符集, 类似但不等价于"[0-9a-zA-Z]"
"\W": 表示非数字字母下划线和Unicode字符集, 类似但不等价于"[^0-9a-zA-Z]"
任意字符
".": 表示除"\n"以外的所有字符, 如需包含"\n", 则需要写成形如"[\s\S]"的表达式
注意: 新手很容易犯的错误, "[.\n]"表示匹配字符"."或者"\n", 并不能表示任意字符
8进制符
"\XX": 其中X取值为"[0-7]". 如"\12", 等同于"\x0A", 等同于"\n"
注意: 当任意一个X取值不为"[0-7]", 将会以非8进制符的方式进行解释
16进制符
"\xXX": 其中X取值为"[0-9a-f]", 不区分大小写. 例如"\x0A"即为换行符
Unicode字符
"\uXXXX": 其中X取值为"[0-9a-f]", 不区分大小写. 例如"\u4E2D"即为"中"
自定义字符集
"[X]": 其中X为单个字符, 数量大于等于1, 取值任意. 例如匹配中文"中"和数字"8", 写作"[中8]", 也可写作"[\u4E2D8]"
文章系列
- 下一篇: 正则表达式-入门-认识功能符
题外话
原创文章真心不容易,希望大家一键三连哦✧(≖ ◡ ≖✿)~。