正则表示式简介
正则表示式基本上包括两种字符:字面意义字符与元字符。
字面意义字符是指按照字面意义比较的字符;
元字符是不按照字面比较,在不同情境有不同意义的字符。
1. 字面意义字符
字符 | 说明 |
---|---|
字母或数字 | 比较字母或数字 |
\\ | 比较\ |
\0n | 八进制0n字符(0<=n<=7) |
\0nn | 八进制0nn字符(0<=n<=7) |
\0mnn | 八进制0mnn字符(0<=m<=3,0<=n<=7) |
\xhh | 十六进制0xhh字符 |
\uhhhh | 十六进制0xhhh字符 |
\xh…h | 十六进制0xh…h字符 |
\t | Tab(\u0009) |
\n | 换行(\u000A) |
\r | 返回(\u000D) |
\f | 换页(\u000C) |
\a | 响铃(\u0007) |
\e | Esc(\u000B) |
\cx | 控制字符x |
元字符在正则表示式中具有特殊的意义,如! $ * ( ) + = { } [ ] | \ : . ?等。若要比较这些字符,则必须加上忽略符号\。如果不确定哪些标点符号字符要加忽略符号,可以在每个标点符号前加上\。
使用java字符串撰写正则表示式比较麻烦。
将正则表示式\|放入” “之间时,按照java字符串规定必须忽略\|中的,所以必须写成”\\|”
for(String token : "Justin|Monica|Irene".split("\\|")){
System.out.println(