Java——正则表达式
1. 概念
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
2. 目的
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”):
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
3. 特点
正则表达式的特点是:
1. 灵活性、逻辑性和功能性非常强;
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说,比较晦涩难懂。
4. 符号
1:字符
x 字符 x。举例:’a’表示字符a
\ 反斜线字符。说白了两个连续的\才能表示一个\
\n 新行(换行)符 (‘\u000A’)
\r 回车符 (‘\u000D’)
2:字符类
[abc] a或者b或c(即abc中的任意一个)(简单类)
[^abc] 除了 a、b 或 c以外的任何字符,(否定)
[a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围) ,即表示了所有的英文字母
[0-9] 0到9的字符都包括,即表示了所有的数字
3:预定义字符类
. 任何字符。如果想表示.字符本身,怎么表示呢? .
\d 数字:[0-9]
\w 单词字符:[a-zA-Z_0-9]
在正则表达式里面组成单词(words)的东西必须有这些东西组成
4:边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界(即不是单词字符的字符;这些字符用于隔开单词)
举例:hello world?haha;xixi
5:Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
5. 代码示例
package cn.com.Hwadee;
/**
* 利用正则表达式判断邮箱地址是否正确
*/
import java.util.Scanner;
public class Test {
public static void main(String[] args) {
test1();
}
public static void test1() {
Scanner sc=new Scanner(System.in);
System.out.println("请输入您的邮箱:");
String s=sc.nextLine();
String regex="\\w{5,}[@]\\w{1,}\\.[c][o][m]"; //正则表达式
boolean matches = s.matches(regex);
System.out.println("输入结果:"+matches);
sc.close();
}
}
6. 结果截图
7. (附)常用的正则匹配工具
1在线匹配工具:
http://www.regexpal.com/
2 正则匹配软件
McTracer
用过几个之后还是觉得这个是最好用的,支持将正则导成对应的语言如java C# js等还帮你转义了,Copy直接用就行了很方便,另外支持把正则表达式用法解释,如哪一段是捕获分组,哪段是贪婪匹配等等,总之用起来 So Happy .