正则表达式问题清单

最新推荐文章于 2024-05-17 15:10:43 发布

千篇不一律

最新推荐文章于 2024-05-17 15:10:43 发布

阅读量255

点赞数

原文链接：https://blog.csdn.net/Architect_CSDN/article/details/89478042

版权

正则表达式问题清单

正则表达式规则
正则表达式中的字符含义
匹配邮箱和电话号码

正则表达式规则

正则表达式
正则表达式是一种特殊的字符串模式，用于匹配一组字符串

贪婪量词
“*”(贪婪) 重复零次或更多
“+”(懒惰) 重复一次或更多次
“?”(占有) 重复零次或一次
“{n}” 重复n次
“{n,m}” 重复n到m次
“{n,}” 重复n次或更多次

懒惰限定符
“*?” 重复任意次，但尽可能少重复
“+?” 重复1次或更多次，但尽可能少重复
“??” 重复0次或1次，但尽可能少重复
“{n,m}?” 重复n到m次，但尽可能少重复
“{n,}?” 重复n次以上，但尽可能少重复

元字符
“^” ：^会匹配字符串的起始位置
" $" ：$ 会匹配字符串的结尾
“\w”：匹配字母，数字，下划线.
“\d”: 匹配数字
“\b” : 匹配单词边界
“\s”：匹配空格
[a-z]匹配a至z的所有字母

几种反义
写法很简单改成大写就行了，意思与原来的相反，这里就不举例子了
“\W” 匹配任意不是字母，数字，下划线的字符
“\S” 匹配任意不是空白符的字符
“\D” 匹配任意非数字的字符
“\B” 匹配不是单词开头或结束的位置
“[^abc]” 匹配除了abc以外的任意字符

捕捉分组
String line = “This order was placed for QT3000! OK?”;
String pattern = "(\D*)(\d+)(.)";
// 创建 Pattern 对象
Pattern r = Pattern.compile(pattern);
// 现在创建 matcher 对象
Matcher m = r.matcher(line);
if (m.find( )) {
则打印： m.group(0)，m.group(1)，m.group(2) ，m.group(3)
}
结果如下：【0组是整个字符串，1是匹配3000以前的，剩下的就是3000! OK?，2组就是在3000! OK?的基础上进行匹配，3组把3000匹配了，4组就是在! OK?里面去继续匹配字符】

正则表达式中的字符含义

字符描述：   
^ ：匹配输入的开始位置。   
\：将下一个字符标记为特殊字符或字面值。   
* ：匹配前一个字符零次或几次。   
+ ：匹配前一个字符一次或多次。   
(pattern) 与模式匹配并记住匹配。   
x|y：匹配 x 或 y。   
[a-z] ：表示某个范围内的字符。与指定区间内的任何字符匹配。   
\w ：与任何单词字符匹配，包括下划线。   
$ ：匹配输入的结尾。

匹配邮箱和电话号码

public class Main {
    public static void main(String[] args) {

        /**
         *    合法E-mail地址：   
         *         1. 必须包含一个并且只有一个符号“@”   
         *         2. 第一个字符不得是“@”或者“.”   
         *         3. 不允许出现“@.”或者.@   
         *         4. 结尾不得是字符“@”或者“.”   
         *         5. 允许“@”前的字符中出现“＋”   
         *         6. 不允许“＋”在最前面，或者“＋@”
         */

        //电子邮件  
        String check = "^([a-z0-9A-Z]+[-|\\.]?)+[a-z0-9A-Z]@([a-z0-9A-Z]+(-[a-z0-9A-Z]+)?\\.)+[a-zA-Z]{2,}$";
        Pattern regex = Pattern.compile(check);
        Matcher matcher = regex.matcher("d12@.23few.@");
        boolean isMatched = matcher.matches();
        System.out.println(isMatched);

        /* 电话号码 
         
        String check = "^(13[4,5,6,7,8,9]|15[0,8,9,1,7]|188|187)\\d{8}$"; 
         Pattern regex = Pattern.compile(check); 
         Matcher matcher = regex.matcher("13555655606"); 
         boolean isMatched = matcher.matches(); 
         System.out.println(isMatched); 
         
        */
    }
}

1. 三个同样的字母连在一起，一定是拼写错误，去掉一个的就好啦：比如 helllo -> hello
2. 两对一样的字母（AABB型）连在一起，一定是拼写错误，去掉第二对的一个字母就好啦：比如 helloo -> hello
3. 上面的规则优先“从左到右”匹配，即如果是AABBCC，虽然AABB和BBCC都是错误拼写，应该优先考虑修复AABB，结果为AABCC

正则\1\2和\1的理解
原创liangf05 发布于2018-02-24 14:06:15 阅读数 11910 收藏
展开
正则表达式中
‘\1’ 匹配的是字符 ‘\1’ 。 (因为 ‘\’ 匹配字符 ‘\’ )
‘\2’ 匹配的是字符 ‘\2’
单独斜杠的 \1 ， \2 就是反向引用了。
‘\1’ 匹配的是所获取的第1个()匹配的引用。例如，’(\d)\1’ 匹配两个连续数字字符。如33aa 中的33
‘\2’ 匹配的是所获取的第2个()匹配的引用。
例如，’(\d)(a)\1’ 匹配第一是数字第二是字符a,第三\1必须匹配第一个一样的数字重复一次，也就是被引用一次。如9a9 被匹配，但9a8不会被匹配，因为第三位的\1必须是9才可以，
‘(\d)(a)\2’ 匹配第一个是一个数字，第二个是a，第三个\2必须是第二组（）中匹配一样的，如，8aa被匹配，但8ab，7a7不会被匹配，第三位必须是第二组字符的复制版，也是就引用第二组正则的匹配内容
以此类推
$1表示正则中第一对圆括号内匹配的内容
$2表示正则中第二对圆括号内匹配的内容

链接：https://www.nowcoder.com/questionTerminal/42852fd7045c442192fa89404ab42e92?orderByHotValue=1&page=1&onlyReference=false
来源：牛客网

public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
        int line = scanner.nextInt();
        scanner.nextLine();
        for (int i = 0; i < line; i++) {
        /**
        *第一个正则把3个以上的字符换成2个，第二个正则把AABB型换成AAB型
        *
        */
            System.out.println(scanner.nextLine().replaceAll("(.)\\1+","$1$1").replaceAll("(.)\\1(.)\\2","$1$1$2"));
        }
    }
}

千篇不一律

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式问题清单

java.util.regex这个包下的类提供了正则表达式的使用下面是一个字符串的模糊查询的使用的例子List<SubjectTrial> subjectTrials = subjectTrialDao.findAllByTrialType(0); LinkedList<Map<String, Object>> linkedList = ne...
复制链接

扫一扫