靓号正则表达式(前后向查找等) 和 apache正则包使用

转载 2015年02月04日 16:01:18


一般公司在开发一类对的号码时,会预留一些号码给以后升级的会员使用,比如旺旺靓号,QQ号等,采用正则表达式实现较好,通过规则引擎的后台页面做成实时可配置的也是不错的选择。

一. 一般会有如下的正则需求

    代码中每行都标有注释,这个就是需求,为设置靓号应该考虑的方面,这里特别提示下,不能忘记跟公司相关的业务,股票代码等检查。

 

 

代码如下:

Java代码 复制代码 收藏代码
  1. public class CreditCodeRegexValidateStategyServiceImpl implements CreditCodeValidateStategyService {  
  2.   
  3.     private static List<String> levitPatterns;  
  4.   
  5.     static synchronized private void init() {  
  6.         if (levitPatterns == null) {  
  7.             levitPatterns = new ArrayList<String>();  
  8.         } else {  
  9.             return;  
  10.         }  
  11.         // 手机号、生日号、跟公司业务相关的号码  
  12.      levitPatterns.add("^(0|13|15|18|168|400|800)[0-9]*$");  
  13.         levitPatterns.add("^\\d{2}(0[1-9]|1[0-2])(0[1-9]|[12][0-9]|3[01])$");  
  14.         levitPatterns.add("^\\d*(1688|2688|2088|2008|5188|10010|10001|666|888|668|686|688|866|868|886|999)\\d*$");  
  15.         // 重复号码,镜子号码  
  16.      levitPatterns.add("^(<a>\\d)(\\d)(\\d)\\1\\2\\3$");  
  17. </a>        levitPatterns.add("^(\\d)(\\d)(\\d)\\3\\2\\1$");  
  18.         // AABB  
  19.         levitPatterns.add("^\\d*(\\d)\\1(\\d)\\2\\d*$");  
  20.         // AAABBB  
  21.         levitPatterns.add("^\\d*(\\d)\\1\\1(\\d)\\2\\2\\d*$");  
  22.         // ABABAB  
  23.         levitPatterns.add("^(\\d)(\\d)\\1\\2\\1\\2\\1\\2$");  
  24.         // ABCABC  
  25.         levitPatterns.add("^(\\d)(\\d)(\\d)\\1\\2\\3$");  
  26.         // ABBABB  
  27.         levitPatterns.add("^(\\d)(\\d)\\2\\1\\2\\2$");  
  28.         // AABAAB  
  29.         levitPatterns.add("^(\\d)\\1(\\d)\\1\\1\\2$");  
  30.           
  31.         // 4-8 位置重复  
  32.         levitPatterns.add("^\\d*(\\d)\\1{2,}\\d*$");  
  33.         // 4位以上 位递增或者递减(7890也是递增)  
  34.         levitPatterns.add("(?:(?:0(?=1)|1(?=2)|2(?=3)|3(?=4)|4(?=5)|5(?=6)|6(?=7)|7(?=8)|8(?=9)|9(?=0)){2,}|(?:0(?=9)|9(?=8)|8(?=7)|7(?=6)|6(?=5)|5(?=4)|4(?=3)|3(?=2)|2(?=1)|1(?=0)){2,})\\d");  
  35.           
  36.         // 不能以 518 、918 结尾  
  37.         levitPatterns.add("^[0-9]*(518|918)$");  
  38.     }  
  39.   
  40.     @Override  
  41.     public boolean isAllow(String input) {  
  42.         Assert.notNull(input);  
  43.         return !RegexUtil.contains(input, levitPatterns);  
  44.     }  
  45.   
  46.     static {  
  47.         init();  
  48.     }  

对于以上正则,前面的大多人都很熟悉了,这里主要讲位置查找和前后向查找,即如下两种号码的判断

  

Java代码 复制代码 收藏代码
  1. // ABBABB  
  2.       levitPatterns.add("^(\\d)(\\d)\\2\\1\\2\\2$");  
Java代码 复制代码 收藏代码
  1. // 4位以上 位递增或者递减(7890也是递增)  
  2.       levitPatterns.add("(?:(?:0(?=1)|1(?=2)|2(?=3)|3(?=4)|4(?=5)|5(?=6)|6(?=7)|7(?=8)|8(?=9)|9(?=0)){2,}|(?:0(?=9)|9(?=8)|8(?=7)|7(?=6)|6(?=5)|5(?=4)|4(?=3)|3(?=2)|2(?=1)|1(?=0)){2,})\\d");  
  3.         

位置查找: \\2\\1\\2\\2 这部分代表的 第一个A 位置是1 第二个B位置是2,重复B则用\\2标识

后向查找   ("(?:(?:0(?=1)| 对于连续号码,?=表示往后看,要判断0后面是1吗,1后面是2吗,如此反复可以得到连续号码

 

二. 使用 org.apache.oro.text.regex.Pattern   代替 java自身带的partern,

为什么抛弃java现有的API不用,而使用perl5规范的正则库呢?他是最全面的正则表达式API,全面兼容perl5,同时也是优化的最好的API之一,在未来的JDK版本中可能会看到的。

 

 

上面程序调用的正则代码如下:

Java代码 复制代码 收藏代码
  1. public class RegexUtil {  
  2.   
  3.     private static PatternCompiler compiler = new Perl5Compiler();  
  4.   
  5.     private static PatternMatcher  matcher  = new Perl5Matcher();  
  6.   
  7.     private static Pattern         pattern  = null;  
  8.   
  9.     /** 
  10.      * 根据正则过滤条件过滤 
  11.      *  
  12.      * @param input 
  13.      * @param levitPatterns 
  14.      * @return 
  15.      * @throws MalformedPatternException 
  16.      */  
  17.     public static boolean contains(String input, String patternString) {  
  18.         try {  
  19.             pattern = compiler.compile(patternString);  
  20.             if (matcher.contains(input, pattern)) {  
  21.                 return true;  
  22.             }  
  23.         } catch (MalformedPatternException e) {  
  24.             return false;  
  25.         }  
  26.         return false;  
  27.     }  
  28.   
  29.     /** 
  30.      * 根据批量正则过滤条件过滤 
  31.      *  
  32.      * @param input 
  33.      * @param patternStrings 
  34.      * @return 
  35.      * @throws MalformedPatternException 
  36.      */  
  37.     public static boolean contains(String input, List<String> patternStrings) {  
  38.         for (Iterator<String> lt = patternStrings.listIterator(); lt.hasNext();) {  
  39.             if (contains(input, (String) lt.next())) {  
  40.                 return true;  
  41.             }  
  42.             continue;  
  43.         }  
  44.         return false;  
  45.     }  
  46. }  

相关文章推荐

UE/US正则表达式查找搜索替换,查询的字符串未找到(UE studio/ultraEdit)/修改UE使用Perl正则引擎

UE默认使用UltraEdit正则表达式,就是UE自己改造过的正则语法,跟常用的perl兼容正则表达式语法不一致,所以即使写对了正则表达式,还会显示“查询的字符串未找到”。 这就需要修改UE的正则引...

正则表达式学习记录-后向引用

使用小括号指定一个子表达式后,匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下,每个分组会自动拥有一个组号,规则是:从左向右,以分组的左括号为标志,第...

正则表达式详解(贪婪与懒惰、前瞻与后顾、后向引用等)

之前嫌正则麻烦,一直没有深入去了解过正则,能不用的地方就不使用。 最近项目中遇到了不可避免的正则使用,所以花了点时间去了解并整理了一下,理解不一定完全准确,如有不对欢迎指出,希望对大家有所帮助。 ...

python正则表达式系列(4)——分组和后向引用

分组,即分组匹配,也称为捕获组,是正则中的一种比较重要的匹配方式。此外后向引用和分组相结合,可以写出很多复杂匹配场景的正则。...
  • dnxbjyj
  • dnxbjyj
  • 2017年04月27日 08:03
  • 1617

正则表达式之分组(捕获)、后向引用

分组          正则表达式中的分组又称为子表达式,就是把一个正则表达式的全部或部分当做一个整体进行   处理,分成一个或多个组。其中分组是使用“()”表示的。进行分组之后“()”里面...
  • kiritor
  • kiritor
  • 2013年03月31日 11:48
  • 3542

正则表达式之分组、后向引用

分组          正则表达式中的分组又称为子表达式,就是把一个正则表达式的全部或部分当做一个整体进行   处理,分成一个或多个组。其中分组是使用“()”表示的。进行分组之后“()”里面...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:靓号正则表达式(前后向查找等) 和 apache正则包使用
举报原因:
原因补充:

(最多只允许输入30个字)