Java精确判断一个字符串是否有中文

Java判断一个字符串是否有中文是利用Unicode编码来判断 ,因为中文的编码区间为: 0x4e00--0x9fbb ,不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。而且利用区间判断中文效率也并不高,例如;str.substring(i, i + 1).matches("[\\u4e00-\\u9fbb]+"),就需要遍历整个字符串,如果字符串太长效率非常低,而且判断标点还会错误。这里提高一个高效准确的判断方法,方法在下面的代码里:private static final boolean isChinese(char c) 。类已经编译通过,运行可以查看结果。 
Java代码   收藏代码
  1. package com.zakisoft.ch;  
  2.   
  3. public class IsChineseOrNot {  
  4.   
  5.     // GENERAL_PUNCTUATION 判断中文的“号  
  6.     // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号  
  7.     // HALFWIDTH_AND_FULLWIDTH_FORMS 判断中文的,号  
  8.     private static final boolean isChinese(char c) {  
  9.         Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);  
  10.         if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
  11.                 || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
  12.                 || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
  13.                 || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
  14.                 || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
  15.                 || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
  16.             return true;  
  17.         }  
  18.         return false;  
  19.     }  
  20.   
  21.     public static final boolean isChinese(String strName) {  
  22.         char[] ch = strName.toCharArray();  
  23.         for (int i = 0; i < ch.length; i++) {  
  24.             char c = ch[i];  
  25.             if (isChinese(c)) {  
  26.                 return true;  
  27.             }  
  28.         }  
  29.         return false;  
  30.     }  
  31.   
  32.     public static void main(String[] args) {  
  33.         System.out.println(isChinese("き"));  
  34.         System.out.println(isChinese("test,.?!%^&*(){}[]"));  
  35.         System.out.println(isChinese("测试"));  
  36.         System.out.println(isChinese("“测试”,。?!%……&*()——{}【】”"));  
  37.     }  
  38.   
  39.     public static final boolean isChineseCharacter(String chineseStr) {  
  40.         char[] charArray = chineseStr.toCharArray();  
  41.         for (int i = 0; i < charArray.length; i++) {  
  42.             if ((charArray[i] >= 0x4e00) && (charArray[i] <= 0x9fbb)) {  
  43.                 return true;  
  44.             }  
  45.         }  
  46.         return false;  
  47.     }  
  48.   
  49.     /** 
  50.      * @deprecated; 弃用。和方法isChineseCharacter比效率太低。 
  51.      * */  
  52.     public static final boolean isChineseCharacter_f2() {  
  53.         String str = "!?";  
  54.         for (int i = 0; i < str.length(); i++) {  
  55.             if (str.substring(i, i + 1).matches("[\\u4e00-\\u9fbb]+")) {  
  56.                 return true;  
  57.             }  
  58.         }  
  59.         return false;  
  60.     }  
  61. }  


System.out.println(isChinese("き")); 
System.out.println(isChinese("test,.?!%^&*(){}[]")); 
System.out.println(isChinese("测试")); 
System.out.println(isChinese("“测试”,。?!%……&*()——{}【】”")); 
运行结果为: 
false 
false 
true 
true
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值