目录
描述
正则表达式在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。
正则表达式由两种基本字符类型组成:文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符(一个或一组代替一个或多个字符的字符)就是指那些在正则表达式中具有特殊意义的专用字符。可以用来规定其前导字符(位于元字符前边的字符)在目标对象中的出现模式。
作用:用来检索、替换那些符合某个模式(规则)的文本。
常用特殊字符
- \ :转义符;
- \d : 代表数字;
- \r : 回车;
- \n : 换行符;
- \t : 制表符;
- \s : 代表任意空白符,包括空格、制表符(Tab),换行符;
- \w : 匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”;
- \W : 匹配任何非单词的字符;
- . : 匹配除换行符以外的任意字符;
- \b : 单词的开始或结束(单词的边界);
- ^ : 匹配字符串的开始;
- $ 匹配字符串的结束;
- * : 匹配前导字符0次或多次;
- + : 匹配前导字符1次或多次;
- ? : 匹配前导字符0次或1次(表示前导字符是可选的);
- {min,max} : 匹配前导字符MIN次到max次。MIN和max都是非负数,{min,}表示max没有限制,{min}匹配min次
- \< \> : 匹配词(word)的开始(<)和结束(>)。
说明:
?等价于匹配长度{0,1}
*等价于匹配长度{0,}
+等价于匹配长度{1,}
\d等价于[0-9]
\D等价于[^0-9]
\w等价于[A-Za-z_0-9]
\W等价于[^A-Za-z_0-9]