软件构造之正则表达式
写Lab3用到了正则表达式,我在这里总结以下什么是正则表达式。
简介
一个正则表达式就是一个描述规则的字符串,所以,只需要编写正确的规则,我们就可以让正则表达式引擎去判断目标字符串是否符合规则。
正则表达式是一套标准,它可以用于任何语言。Java标准库的java.util.regex包内置了正则表达式引擎,在Java程序中使用正则表达式非常简单。
举个例子:要判断用户输入的年份是否是20##年,我们先写出规则如下:
一共有4个字符,分别是:2,0,09任意数字,09任意数字。
对应的正则表达式就是:20\d\d,其中\d表示任意一个数字。
把正则表达式转换为Java字符串就变成了20\d\d,注意Java字符串用\表示\。
常见匹配规则
正则表达式的匹配规则是从左到右按规则匹配。我们首先来看如何使用正则表达式来做精确匹配。
对于正则表达式abc来说,它只能精确地匹配字符串"abc",不能匹配"ab",“Abc”,"abcd"等其他任何字符串。
如果正则表达式有特殊字符,那就需要用\转义。例如,正则表达式a&c,其中&是用来匹配特殊字符&的,它能精确匹配字符串"a&c",但不能匹配"ac"、“a-c”、"a&&c"等。
匹配任意字符
精确匹配实际上用处不大,因为我们直接用String.equals()就可以做到。大多数情况下,我们想要的匹配规则更多的是模糊匹配。我们可以用.匹配一个任意字符。
例如,正则表达式a.c中间的.可以匹配一个任意字符,例如,下面的字符串都可以被匹配:
“abc”,因为.可以匹配字符b;
“a&c”,因为.可以匹配字符&;
“acc”,因为.可以匹配字符c。
但它不能匹配"ac"、“a&&c”,因为.匹配一个字符且仅限一个字符。
匹配数字
用.可以匹配任意字符,这个口子开得有点大。如果我们只想匹配0~9这样的数字,可以用\d匹配。例如,正则表达式00\d可以匹配:
“007”,因为\d可以匹配字符7;
“008”,因为\d可以匹配字符8。
它不能匹配"00A",“0077”,因为\d仅限单个数字字符。