Java正则表达式
一、什么是正则表达式
正则表达式定义了字符串的模式,本质是一种特殊的字符串对象。
正则表达式可以用来搜索、编辑或处理文本。
正则表达式并不局限于某一种语言,但是在每种语言中有细微的差别。
正则表达式基本语法规则
字符 | 说明 | 实例 |
---|---|---|
^ | 表达式开始 | |
$ | 表达式结尾 | |
[358a-z] | 一个符号,符号范围在3,5,8,a-z | |
\d === [0-9] | 代表一位数字 | \\\d{9} |
\d+ | 代表1个数字,或多个数字 | 相当[0-9]{1,} |
\d{3} | 代表3个数字 | 相当于[9-9]{3} |
[\u4e00-\u9fa5]{2,8} | 代表2到8个汉字字符 | |
* | 代表0个或多个前边的符号 {0,} | [a-z]* |
. | 代表1个任意的符号 | str.matches(“^.+$”) |
+ | 代表1个或多个前边的符号{1,} | \d+ |
? | 代表0个或1个前边的符号 {0,1} | |
{n} | n个 | |
{n,} | n个或多个 | |
{m,n} | [a-zA-Z_0-9]{6,18} 和 \w{6,18} | |
\D | [^0-9] | |
\w | [a-zA-Z0-9_] | |
\W | [^a-zA-Z0-9_] | |
| | 匹配或正则表达式或,分组功能 | |
() | 分组 | |
\s | 代表空格 | \s |
二、正则表达式实例
最近无聊就把一些常用的正则表达式打包成一个个方法,其实有些方法很短不需要打包我只是把一些true|false 型的结果变成可以直接看到的String结果。大家可以选择性的使用。
-
判断字符传中有没有大写字母
public static String AZ(String a) {//判断有没有大写字母 String msg = ""; if (a.matches(".*[A-Z].*")) { msg = "有大写字母"; } else { msg = "没有大写字母"; } return msg; }
-
把字符串中的数字替换成"-"
public static String repnum(String u) {//把数字替换成"-" u = u.replaceAll("\\d{1,6}", "-"); return u; }
-
打印输出
标签中的内容public static String div(String u) { Pattern p = Pattern.compile("<div>java</div>"); Matcher m = p.matcher(u); while (m.find()) { u = m.group(); } return u; }
-
判断字符是不是纯中文或有没有中文
public static String HZ(String a) { String msg = ""; if (a.matches("^[\u4e00-\u9fa5]$")) {//是不是纯中文 //if (a.matches(".*[\u4e00-\u9fa5].*")) {//判断字符串里有没有中文 msg = "是纯中文"; } else { msg = "不是纯中文"; } return msg; }
-
判断是不是手机号或有没有手机号
public static String phonenumber(String u) { String msg = ""; String pattern = "^1[3,58]\\d{9}"; // String pattern = "^.*1[3,58]\\d{9}.*";//也可以判断字符串有没有手机号 if(u.matches(pattern)){ msg = "是手机号"; }else { msg = "不是手机号"; } return msg; }
2.1正则表达式的贪婪问题
在实例中有个将字符串中的数字替换为"-“的例子里面就会遇到一个问题,它会将所有的数字替换为一个”-"。这就出现了正则贪婪,有时我们不希望将所有的数字替换为一个 “-”,所以就需要一个方法禁用贪婪。
-
出现正则贪婪
-
禁用贪婪
将replaeALL( )中的内容改为即在后面加一个?
"\\d{1,6}?", "-"
? 起到了一个禁用贪婪的作用。它可以让程序尽可能的少匹配字符,当有一个字符满足条件是就结束本次匹配。
-
2.2 正则表达式分组
概述:正则表达式可以通过”()”来进行分组,更专业的表达就是捕获组,每个完整的”()”可以分为一组,同时,”()”中还可以嵌套”()”,即组之间还可以存在更小的组,以此类推。这样就可以以组为单位控制字符串。
-
实例:将<div> java 数字</div> 替换为 <h3>java</h3>
-
即把 (>java \\d+</) 放在 <h3 h3>中间
public static void main(String[] args) { String a = "java213php12javascrip11lang"; String b = "<div>java</div><span>hello</span><div>javascript<div/>"; String str = """ <div>hello</div><div>java 15</div><div><p>java 15</p> <span>java 8</p><div>java 13</div><div>java 162423423</div> """; System.out.println(str.replaceAll("<(div)(>java \\d+</)(div)>", "<h3$2h3>"));