1,非打印字符
========================================================================================================
字符 描述
\cx 匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则将c视为一个原义的'c'字符
\f 匹配一个换页符
\n 匹配一个换行符
\r 匹配一个回车符
\s 匹配任何空白字符
\S 匹配任何非空白字符
\t 匹配一个制表符
\v 匹配一个垂直制表符
2,特殊字符
========================================================================================================
特殊字符 描述
$ 匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性,则 $ 也匹配 '\n' 或 '\r'。
() 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。
* 匹配前面的子表达式0次或多次。
+ 匹配前面的子表达式1次或多次。
. 匹配除换行符\n之外的任何单字符。要匹配 . , 请输入 \. Java.lang.String.split("[.]")可以匹配 . )
[] 结合起来表示某特定类型的字符,如[abc]表示可以是abc中任意一个
? 匹配前面的子表达式0次或1次,或指明一个非贪婪限定符。
\ 将下一个字符标记为或特殊字符,或原义字符,或向后引用,或八进制转义符。
^ 表示模式必须出现在目标串的开始,除非在方括号表达式中使用,此时它表示不接受该字符集合。
{} 结合起来表示匹配的次数。例如ab{2}可匹配abb。ab{2,}表示至少2次,ab{2,4}表示至少2次,最多4次。
| 指明两项之间的一个选择。
3,预定义词
========================================================================================================
字符 描述
\d 表示一个数字,同[0-9]
\D 表示一个非数字字符[^0-9]
\s 表示一个白字符,同[\t\n\x0b\f\r]
\S 表示一个非白字符,同[^\t\n\x0b\f\r]
\w 一个字符,可以是字母,数字或下划线,同[a-zA-Z_0-9]
\W 一个字符,不能是字母,数字或下划线,同[^a-zA-Z_0-9]
4,定位符
========================================================================================================
字符 描述
^ 匹配输入字符串开始的位置。如果设置了RegExp对象的Multiline属性,^ 还会与 \n 或 \r 之后的位置匹配
$ 匹配输入字符串结尾的位置。如果设置了RegExp对象的Multiline属性,$ 还会与 \n 或 \r 之后的位置匹配
\b 匹配一个字边界,即字与空格间的位置
\B 非字边界匹配
[注意:限定符不能和定位点一起使用。由于在紧靠换行或者字边界的前面或后面不能有一个以上位置,因此不允许诸如 ^* 之类的表达式]
[注意:若要匹配一行文本开始处的文本,请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆]
[注意:若要匹配一行文本结束处的文本,请在正则表达式的结束处使用 $ 字符]
1.正则表达式基本语法
两个特殊的符号’^’和’$’。他们的作用是分别指出一个字符串的开始和结束。例子如下:
"^The":表示所有以"The"开始的字符串("There","The cat"等);
"of despair$":表示所以以"of despair"结尾的字符串;
"^abc$":表示开始和结尾都是"abc"的字符串——呵呵,只有"abc"自己了;
"notice":表示任何包含"notice"的字符串。
其它还有’*’,’+’和’?’这三个符号,表示一个或一序列字符重复出现的次数。它们分别表示“没有或
更多”,“一次或更多”还有“没有或一次”。下面是几个例子:
"ab*":表示一个字符串有一个a后面跟着零个或若干个b。("a", "ab", "abbb",……);
"ab+":表示一个字符串有一个a后面跟着至少一个b或者更多;
"ab?":表示一个字符串有一个a后面跟着零个或者一个b;
"a?b+$":表示在字符串的末尾有零个或一个a跟着一个或几个b。
你也可以使用范围,用大括号括起,用以表示重复次数的范围。
"ab{2}":表示一个字符串有一个a跟着2个b("abb");
"ab{2,}":表示一个字符串有一个a跟着至少2个b;
"ab{3,5}":表示一个字符串有一个a跟着3到5个b。
请注意,你必须指定范围的下限(如:”{0,2}”而不是”{,2}”)。还有,你可能注意到了,’*’,’+’和
‘?’相当于”{0,}”,”{1,}”和”{0,1}”。
还有一个’|’,表示“或”操作:
"hi|hello":表示一个字符串里有"hi"或者"hello";
"(b|cd)ef":表示"bef"或"cdef";
"(a|b)*c":表示一串"a""b"混合的字符串后面跟一个"c";
‘.’可以替代任何字符:
"a.[0-9]":表示一个字符串有一个"a"后面跟着一个任意字符和一个数字;
"^.{3}$":表示有任意三个字符的字符串(长度为3个字符);
方括号表示某些字符允许在一个字符串中的某一特定位置出现:
"[ab]":表示一个字符串有一个"a"或"b"(相当于"a¦b");
"[a-d]":表示一个字符串包含小写的'a'到'd'中的一个(相当于"a¦b¦c¦d"或者"[abcd]");
"^[a-zA-Z]":表示一个以字母开头的字符串;
"[0-9]%":表示一个百分号前有一位的数字;
",[a-zA-Z0-9]$":表示一个字符串以一个逗号后面跟着一个字母或数字结束。
你也可以在方括号里用’^’表示不希望出现的字符,’^’应在方括号里的第一位。(如:”%[^a-zA-Z]%”表
示两个百分号中不应该出现字母)。
为了逐字表达,你必须在”^.$()¦*+?{\”这些字符前加上转移字符’\’。
请注意在方括号中,不需要转义字符。
3.正则表达式的应用实例通俗说明
//校验是否全由数字组成
^[0-9]{1,20}$
^ 表示打头的字符要匹配紧跟^后面的规则
表示打头的字符要匹配紧靠 前面的规则
[ ] 中的内容是可选字符集
[0-9] 表示要求字符范围在0-9之间
{1,20}表示数字字符串长度合法为1到20,即为[0-9]中的字符出现次数的范围是1到20次。
//校验登录名:只能输入5-20个以字母开头、可带数字、“_”、“.”的字串
^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$
^[a-zA-Z]{1} 表示第一个字符要求是字母。
([a-zA-Z0-9]|[.]){4,19} 表示从第二位开始(因为它紧跟在上个表达式后面)的一个长度为4到9位的字符串,它要求是由大小写字母、数字或者特殊字符集[.]组成。
//校验用户姓名:只能输入1-30个以字母开头的字串
^[a-zA-Z]{1,30}$
//校验密码:只能输入6-20个字母、数字、下划线
^(\w){6,20}$
\w:用于匹配字母,数字或下划线字符
//校验普通电话、传真号码:可以“+”或数字开头,可含有“-” 和 “ ”
^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$
\d:用于匹配从0到9的数字;
“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次
可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等
//校验URL
^http[s]{0,1}:\/\/.+
/或/http[s]0,1:\/\/.1,n
(表示url串的长度为length(“https://”) + n )
\/ :表示字符“/”。
. 表示所有字符的集
- 等同于{1,},就是1到正无穷吧。
//校验纯中文字符
^[\u4E00-\u9FA5]+$
[\u4E00-\u9FA5] :估计是中文字符集的范围吧
4.正則表達式應用
^\d+(.\d+)*$ 数字
^[0-9][1-9][0-9]$ 正整数
^(-?\d+)(.\d+)?$ 浮点数
[\u4e00-\u9fa5] 中文字符
[^\x00-\xff] 双字节字符包括中文
^[A-Za-z0-9]+$ 由数字和26个英文字母组成的字符串
\n[\s|]*\r 空行
^\w-*@[\w-]+(.[\w-]+)+$ EMail地址
\d{3}-\d{8}|\d{4}-\d{7} 国内电话号码
\d{15}|\d{18} 身份证号