关于正则表达式在不同的语言中的形式略有差别,今天做题的时候发现正则表达式的语法不是很清楚,就来总结一下Java的正则表达式。
什么是正则表达式?
正则表达式可以用来匹配字符串,编辑,处理文本。可以规定一种字符串文本书写的固定模式。
比如:一句普通的字符串:”Are you OK?”就是一个正则表达式。
^
:表示以什么开始$
:定义什么时候结束*
:零次或者多次匹配前面的字符或者字符串,*
等效于{0,}
{n,}
:表示前面的字符至少出现n次{n,m}
:表示至少n次最多m次匹配,逗号前后不能有空格.
:匹配任意一个字符+
:表示一次或多次匹配前面的字符或表达式,等效于{1,}
\\s+
:匹配一个或者多个空格\\d+
:匹配一个或者多个数字?
:表示零次或1次匹配前面的字符或者表达式,等效于{0,1}
()?
:定义了括号内的选项是可选的a|b
:匹配a或者b,a和b并表示字符或者字符串[a-zA-Z]
:表示匹配范围内包括的任一大小写英文字符[^abc]
:反向,匹配不包括abc的所有任何字符\\b
:匹配边界上的字符,即临近空格的匹配项,例如 “ce\b” 匹配 “preference”中的”ce”,而不匹配”scenario”中的”ce”\\B
:匹配相反的,非字符边界\\d
:单个数字字符匹配\\D
:非数字字符匹配\\s
:空白字符匹配,空格,制表符,换页符,等效于”[\f\n\t\r\v]”\\S
:任何非空白字符
有一点要搞清楚:
1、在其他语言中,\\
表示:在正则表达式中插入一个普通的反斜杠 \
,没有什么特殊的意义,只是一个字符。而 \
则表示是转义字符,例如:\t
。
2、而在Java正则表达式中,\\
表示插入一个 \
,这使得后面的字符具有特殊意义。可以理解为把 \\
作为一个 \
表示转义。例如:\\d
在Java中表示一位数字,\\\\
才表示两个反斜杠 \\
;\\)
表示右括号 )
。
Java中源代码字符串中间的 \
被解释为转义,因此必须在写字符串的时候用两个 \
,表示正则表达式中受到保护,不被Java字节码解释器解释。
小栗子
【例如】:当解释正则表达式时,字符串”\b”被解释为单个退格字符,而”\b”才时边界单词匹配。
【例如】:假定一个英文表示的地址格式要求是:
数字号码(至少一个),然后是一个或者多个空格隔开,再是一个单词(至少两个字母)表示的地名,或者是用空格隔开的两个单词(至少两个字母)表示的地名。
此题该怎么表示呢?
答案:
String regex = "\\d+\\s([a-zA-Z]{2,}|[a-zA-Z]{2,}\\s+[a-zA-Z]{2,})";
Pattern.matches(regex,str);
或者
str.matches(regex);
str为输入的或者说要和正则表达式匹配的字符串呐