一、正则表达式是什么
正则表达式是一个用于匹配字符串的模板,由普通字符和特殊字符组成,能够匹配一匹字符串。
二、正则表达式的使用
1.java.util.regex
使用正则表达式首先需要引入 java.util.regex 包。
java.util.regex 包主要包括以下三个类:
- Pattern 类:
pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。 - Matcher 类:
Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。 - PatternSyntaxException:
PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
2.常用字符
字符 | 含义 |
---|---|
^ | 匹配输入字符串开始的位置 |
$ | 匹配输入字符串结尾的位置 |
* | 零次或多次匹配前面的字符或子表达式 |
+ | 一次或多次匹配前面的字符或子表达式 |
? | 零次或一次匹配前面的字符或子表达式 |
{n} | n 是非负整数,匹配n次 |
{n,} | n 是非负整数,至少匹配 n 次 |
{n,m} | m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次 |
[xyz] | 字符集,匹配包含的任一字符 |
[ ^xyz] | 反向字符集,匹配未包含的任何字符 |
[a-z] | 字符范围,匹配指定范围内的任何字符 |
\d | 数字字符匹配,等效于 [0-9] |
\D | 非数字字符匹配,等效于 [ ^0-9] |
\s | 匹配空白字符[\f\n\r\t\v] |
\S | 匹配非空白字符[^\f\n\r\t\v] |
\w | 匹配任何字类字符,包括下划线,与"[A-Za-z0-9_]"等效 |
\W | 与任何非单词字符匹配,与"[ ^A-Za-z0-9_]"等效 |
… | … |
3.常用表达式
^\d+$
:非负整数(正整数 + 0)^[0-9]*[1-9][0-9]*$
:正整数^((-\d+)|(0+))$
:非正整数(负整数 + 0)^-[0-9]*[1-9][0-9]*$
:负整数^-?\d+$
:整数^\d+(\.\d+)?$
:非负浮点数(正浮点数 + 0)^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
:正浮点数^((-\d+(\.\d+)?)|(0+(\.0+)?))$
:非正浮点数(负浮点数 + 0)^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
:负浮点数^(-?\d+)(\.\d+)?$
:浮点数^[A-Za-z]+$
:由26个英文字母组成的字符串^[A-Z]+$
:由26个英文字母的大写组成的字符串^[a-z]+$
:由26个英文字母的小写组成的字符串^[A-Za-z0-9]+$
:由数字和26个英文字母组成的字符串^\w+$
:由数字、26个英文字母或者下划线组成的字符串^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
:email地址/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/
:年-月-日/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/
:月/日/年/^((\+?[0-9]{2,4}\-[0-9]{3,4}\-)|([0-9]{3,4}\-))?([0-9]{7,8})(\-[0-9]+)?$/
:电话号码^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$
:IP地址^([0-9]){7,18}(x
:短身份证号码(数字、字母x结尾)^\d{15}$
:身份证号(15位、18位数字)^[1-9]*[1-9][0-9]*$
:腾讯QQ号
三、注意事项
1、Java字符串’ \ ‘才能表示转义,可以理解成第1个’‘转义第2个’’。所以对’.‘和’$‘这些特殊字符转义,Java里面要表示为’.‘和’$’。
2、非贪心匹配,找到合适的就结束,尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。