Java正则表达式识别中文

从由汉字,大小写英文,数字组成的语句中分离汉字:
  1. public static void regxChinese()  
  2.    {  
  3.        String source = "桑德斯ABdD3ddd5222字符串转换健康康可能34f丰富4f成小写dx5kljfdsljDSknf943立即地方立即的ddd顶顶顶3";  
  4.        String reg_charset = "([a-z]*)([A-Z]*)([0-9]*)([\u4E00-\u9FA5]*)";  
  5.        Pattern p = Pattern.compile(reg_charset);  
  6.        Matcher m = p.matcher(source);  
  7.        String tag = "demo";  
  8.        while (m.find())  
  9.        {  
  10.            Log.d(tag,"0~~~~~~~~~~~~~~~ " +  m.group(0));  
  11.            Log.d(tag,"1~~~ " +  m.group(1));  
  12.            Log.d(tag,"2~~~ " +  m.group(2));  
  13.            Log.d(tag,"3~~~ " +  m.group(3));  
  14.            Log.d(tag,"4~~~ " +  m.group(4));  
  15.        }  
  16.    }  

以上方法也实现了将大写英文,小写英文,数字,中文的互相分离。


原文链接: http://blog.csdn.net/hopezhangbo/article/details/7356558

转载于:https://my.oschina.net/chen106106/blog/51698

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值