-
基本元件
元字符
所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,元字符是构成正则表达式的基本元件。
元字符大致分类
- 表示单个特殊字符的
- 表示空白符的
- 表示某个范围的
- 表示次数的量词
- 另外还有表示断言的(我们可以把它理解成边界限定)
特殊单字符
- 英文的点(.)表示换行以外的任意单个字符
- \d 表示任意单个数字, \D表示任意单个非数字
- \w 表示任意单个数字或字母或下划线, \W表示任意单个非数字或字母或下划线
- \s 表示任意单个空白符, \S表示任意单个非空白符
空白符
- \r回车符
- \n换行符
- \s代表任意单个空白符号
- \f换页符
- \t TAB 制表符
- \v垂直制表符
量词
- 英文的星号(*)代表出现 0 到多次
- 加号(+)代表 1 到多次
- 问号(?)代表 0 到 1 次
- {m}代表出现m次
- {m,}代表至少出现m次
- {m,n}代表 m 到 n 次
范围
- 管道符号 |,用它来隔开多个正则,表示满足其中任意一个就行,比如 ab|bc 能匹配上 ab,也能匹配上 bc,在正则有多种情况时,这个非常有用。
- 中括号[]代表多选一,可以表示里面的任意单个字符,任意元音字母可以用 [aeiou] 来表示。另外,中括号中,还可以用中划线表示范围,比如 [a-z] 可以表示所有小写字母。
- 脱字符(^)表示非,表达的是不能是里面的任何单个元素。