正则表达式
概念
正则表达式,又称规则表达式。
(英语:Regular Expression,在代码中常简写为regex、regexp或RE),
计算机科学的一个概念。
正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
在众多语言中都可以支持正则表达式,如Perl、PHP、Java、Python、Ruby等。
当然在Java中也可以通过处理字符串的方式达到检索,替换文本字符串的目的,
但是有了正则表达式写代码更加简洁,通常两三行代码就可以达到目的,
当然这也是建立在熟悉正则表达式的基础之上的。
正则表达式规则
-
任意一个字符表示匹配任意对应的字符,如a匹配a,7匹配7,-匹配-。
-
[]代表匹配中括号中其中任一个字符,如[abc]匹配a或b或c。
-
-在中括号里面和外面代表含义不同,如在外时,就匹配-,如果在中括号内[a-b]表示匹配26个小写字母中的任一个;[a-zA-Z]匹配大小写共52个字母中任一个;[0-9]匹配十个数字中任一个。
-
^在中括号里面和外面含义不同,如在外时,就表示开头,如 ^7[0-9]表示匹配开头是7的,且第二位是任一数字的字符串;如果在中括号里面,表示除了这个字符之外的任意字符(包括数字,特殊字符),如 [^abc]表示匹配出去abc之外的其他任一字符。
-
.表示匹配任意的字符。
-
\d表示数字。
-
\D表示非数字。
</