JAVA work5
什么是正则表达式
正则表达式定义了字符串的模式。
正则表达式可以用来搜索、编辑或处理文本。
正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别
一个字符串其实就是一个简单的正则表达式,例如 good morning正则表达式匹配 "good morning" 字符串。
.(点号)也是一个正则表达式,它匹配任何一个字符如:"a" 或 "1"。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
- 1. 给定的字符串是否符合正则表达式的过滤逻辑(称作"匹配");
- 2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
- 1. 灵活性、逻辑性和功能性非常的强;
- 2. 可以迅速地用极简单的方式达到字符串的复杂控制。
- 3. 对于刚接触的人来说,比较晦涩难懂。
常见的符号及其规则
正则表达式 | 描述 |
. | 匹配任何字符 |
^ | 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与”\n”或”\r”之后的位置匹配。。 |
$ | 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与”\n”或”\r”之前的位置匹配。。 |
\d | 数字字符匹配。等效于 [0-9]。] |
\D | 非数字字符匹配。等效于 [^0-9]。 |
\W | 匹配任何字类字符,包括下划线。与”[A-Za-z0-9_]”等效。 |
* | 出现零次或更多次,等效于{0,} ,例如,jia* 匹配”ji”和”jian”{0,} |
+ | 发生一次或多次,是{1,}的缩写 {1,} |
? | 没有发生次或一次,? 是{0,1}的缩写 |
Pattern 和Matcher
- Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。
- Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。
样例使用正则表达式查找字符串中数字出现的位置:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class PrimitiveTypeTest {
//查找数字,返回位置
private static final String regex ="\\d+";
private static final String input ="0 cat catt catre cat cat 9";
public static void main(String[] Args) {
Pattern p =Pattern.compile(regex);
Matcher q =p.matcher(input);
int count=0;
while(q.find()) {
count++;
System.out.println("match number"+count);
System.out.println("start()"+q.start());
System.out.println("end()"+q.end());
}
}
}
常用表达式
数字
1 数字:^[0-9]*$
2 n位的数字:^\d{n}$
3 至少n位的数字:^\d{n,}$
4 m-n位的数字:^\d{m,n}$
5 零和非零开头的数字:^(0|[1-9][0-9]*)$
6 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7 带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
8 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
9 有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
校检符
1 汉字:^[\u4e00-\u9fa5]{0,}$
2 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 长度为3-20的所有字符:^.{3,20}$
4 由26个英文字母组成的字符串:^[A-Za-z]+$
5 由26个大写英文字母组成的字符串:^[A-Z]+$
6 由26个小写英文字母组成的字符串:^[a-z]+$
7 由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$