java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

假如现在有一个需求,要你用Java语言来匹配出一个文本里面的所有(英文半角)标点符号,你会怎么写呢?我想大多数人应该是把这些符号都罗列出来,

如:

!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

但[!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~]这样写需要转义一下,

结果为:

[-!"\#\$%&'()*+,./:;<=>?@

 

\^_`\{\|\}~]

 

然后写到java代码后,有需要转义一次,

变为:

[-!\"\\#\\$%&'()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]

这样的代码,细思极恐。惊恐

我们先来用java代码验证一下,这个长长的正则能不能用

 

[java]  view plain  copy
 
 print?
  1. String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";  
  2.         String regex="[-!\"\\#\\$%&'()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]";  
  3.         Matcher m=Pattern.compile(regex).matcher(str);  
  4.         while(m.find()){  
  5.             System.out.print(m.group());  
  6.         }  

输出结果:

 

~-,#,+=;@.^(){}

很欣慰,正则应该是没错的。但这样的正则看起来挺反胃的,那么有没有简洁的写法呢?答案是有的,可以利用POSIX字符类来实现,正则为:\p{Punct}

 

[java]  view plain  copy
 
 print?
  1. String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";  
  2.         String regex="\\p{Punct}";  
  3.         Matcher m=Pattern.compile(regex).matcher(str);  
  4.         while(m.find()){  
  5.             System.out.print(m.group());  
  6.         }  

输出结果:

 

~-,#,+=;@.^(){}

简直了,是不是对正则又燃起了希望之火大笑,这就是在恰当的时候用POSIX字符类的好处。虽然平时比较少运用POSIX字符类的写法,但在恰当的时机运用起来就会有一种一鸣惊人的感觉。

那么我们来看看POSIX字符类有哪些:

除了POSIX字符类之外,还有一个也知道提一下,那就是Unicode块和类别的类

 

转载于:https://www.cnblogs.com/ptqueen/p/7019084.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值