正则表达式
正则表达式是一种字符串的格式表达。
对于Java而言,在正则表达式的语法中,\\
表示转义符,将后面的字符赋予特殊意义,而\\\\
表示单个\字符。
基本的正则表达式语法如下:
^ | 代表开始匹配的位置 |
---|---|
$ | 表示结束匹配的位置 |
. | 表示匹配单个字符 |
* | 表示匹配前面一个字符0次或多次 |
? | 0次或一次匹配前面的字符或子表达式,非贪心,倾向于0次 |
{n} | n 是非负整数,正好匹配 n 次 |
{n,m} | m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次,可以没有m |
x|y | 匹配x或y,xy可以是多个字符 |
() | 括号中是一个表达式,捕获匹配该表达式的字符串 |
[] | 表示一个字符集,能匹配其中所有字符,[后面加^表示反向,即不匹配这些字符 |
用该语法表达的匹配模式本身是一个字符串。
split方法对于正则表达式的应用
split(regex,int)方法返回一个字符串数组。
regex表示正则表达式参数,是一个字符串的形式,在split中表现为匹配所有符合该表达式的字符并将原字符串按其分割。
int表示将原字符串分成几份。
但是实测在split对于正则表达式应用的时候,{}控制匹配次数的方法在使用split时不生效。