正则表达式

最新推荐文章于 2022-02-18 21:26:22 发布

newcih

最新推荐文章于 2022-02-18 21:26:22 发布

阅读量434

点赞数

分类专栏： Java 文章标签：正则表达式

本文链接：https://blog.csdn.net/NEWCIH/article/details/75579827

版权

Java 专栏收录该内容

29 篇文章 1 订阅

订阅专栏

1，非打印字符

========================================================================================================
字符描述

\cx             匹配由x指明的控制字符。例如，\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则将c视为一个原义的'c'字符

\f              匹配一个换页符

\n              匹配一个换行符

\r              匹配一个回车符

\s              匹配任何空白字符

\S              匹配任何非空白字符

\t              匹配一个制表符

\v              匹配一个垂直制表符

2,特殊字符

========================================================================================================
特殊字符描述

$			匹配输入字符串的结尾位置。如果设置了RegExp对象的Multiline属性，则 $ 也匹配 '\n' 或 '\r'。

()          标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。

*           匹配前面的子表达式0次或多次。

+           匹配前面的子表达式1次或多次。

.           匹配除换行符\n之外的任何单字符。要匹配 . ，    请输入 \.  Java.lang.String.split("[.]")可以匹配 . ）

[]          结合起来表示某特定类型的字符，如[abc]表示可以是abc中任意一个

?           匹配前面的子表达式0次或1次，或指明一个非贪婪限定符。

\           将下一个字符标记为或特殊字符，或原义字符，或向后引用，或八进制转义符。

^           表示模式必须出现在目标串的开始，除非在方括号表达式中使用，此时它表示不接受该字符集合。

{}          结合起来表示匹配的次数。例如ab{2}可匹配abb。ab{2,}表示至少2次，ab{2,4}表示至少2次，最多4次。

|           指明两项之间的一个选择。

3,预定义词

========================================================================================================

字符          描述

\d          表示一个数字，同[0-9]

\D          表示一个非数字字符[^0-9]

\s          表示一个白字符，同[\t\n\x0b\f\r]

\S          表示一个非白字符，同[^\t\n\x0b\f\r]

\w          一个字符，可以是字母，数字或下划线，同[a-zA-Z_0-9]

\W          一个字符，不能是字母，数字或下划线，同[^a-zA-Z_0-9]

4,定位符

========================================================================================================

字符              描述
^               匹配输入字符串开始的位置。如果设置了RegExp对象的Multiline属性，^ 还会与 \n 或 \r 之后的位置匹配

$				匹配输入字符串结尾的位置。如果设置了RegExp对象的Multiline属性，$ 还会与 \n 或 \r 之后的位置匹配

\b              匹配一个字边界，即字与空格间的位置

\B              非字边界匹配



[注意：限定符不能和定位点一起使用。由于在紧靠换行或者字边界的前面或后面不能有一个以上位置，因此不允许诸如 ^* 之类的表达式]

[注意：若要匹配一行文本开始处的文本，请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆]

[注意：若要匹配一行文本结束处的文本，请在正则表达式的结束处使用 $ 字符]

1.正则表达式基本语法

两个特殊的符号’^’和’$’。他们的作用是分别指出一个字符串的开始和结束。例子如下：

"^The"：表示所有以"The"开始的字符串（"There"，"The cat"等）；

"of despair$"：表示所以以"of despair"结尾的字符串；

"^abc$"：表示开始和结尾都是"abc"的字符串——呵呵，只有"abc"自己了；

"notice"：表示任何包含"notice"的字符串。

其它还有’*’，’+’和’?’这三个符号，表示一个或一序列字符重复出现的次数。它们分别表示“没有或
更多”，“一次或更多”还有“没有或一次”。下面是几个例子：

"ab*"：表示一个字符串有一个a后面跟着零个或若干个b。（"a", "ab", "abbb",……）；

"ab+"：表示一个字符串有一个a后面跟着至少一个b或者更多；

"ab?"：表示一个字符串有一个a后面跟着零个或者一个b；

"a?b+$"：表示在字符串的末尾有零个或一个a跟着一个或几个b。

你也可以使用范围，用大括号括起，用以表示重复次数的范围。

"ab{2}"：表示一个字符串有一个a跟着2个b（"abb"）；

"ab{2,}"：表示一个字符串有一个a跟着至少2个b；

"ab{3,5}"：表示一个字符串有一个a跟着3到5个b。

请注意，你必须指定范围的下限（如：”{0,2}”而不是”{,2}”）。还有，你可能注意到了，’*’，’+’和
‘?’相当于”{0,}”，”{1,}”和”{0,1}”。
还有一个’|’，表示“或”操作：

"hi|hello"：表示一个字符串里有"hi"或者"hello"；

"(b|cd)ef"：表示"bef"或"cdef"；

"(a|b)*c"：表示一串"a""b"混合的字符串后面跟一个"c"；

‘.’可以替代任何字符：

"a.[0-9]"：表示一个字符串有一个"a"后面跟着一个任意字符和一个数字；
"^.{3}$"：表示有任意三个字符的字符串（长度为3个字符）；

方括号表示某些字符允许在一个字符串中的某一特定位置出现：

"[ab]"：表示一个字符串有一个"a"或"b"（相当于"a¦b"）；

"[a-d]"：表示一个字符串包含小写的'a'到'd'中的一个（相当于"a¦b¦c¦d"或者"[abcd]"）；

"^[a-zA-Z]"：表示一个以字母开头的字符串；

"[0-9]%"：表示一个百分号前有一位的数字；

",[a-zA-Z0-9]$"：表示一个字符串以一个逗号后面跟着一个字母或数字结束。

你也可以在方括号里用’^’表示不希望出现的字符，’^’应在方括号里的第一位。（如：”%[^a-zA-Z]%”表
示两个百分号中不应该出现字母）。

为了逐字表达，你必须在”^.$()¦*+?{\”这些字符前加上转移字符’\’。
请注意在方括号中，不需要转义字符。

3.正则表达式的应用实例通俗说明

//校验是否全由数字组成

^[0-9]{1,20}$

^ 表示打头的字符要匹配紧跟^后面的规则

$表示打头的字符要匹配紧靠$ 前面的规则