java中统计特殊字符_JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数

引言

可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或'A'~'Z'等,Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 但通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。所以通过Character.UnicodeBlock来进行判断。代码如下:

package cn.csrc.base.count;

public class CountCharacter {

public static void main(String[] args) {

String str ="我爱你abcd123中国 #!";

CountCharacter countCharacter = new CountCharacter();

countCharacter.count(str);

}

/**中文字符 */

private int chCharacter = 0;

/**英文字符 */

private int enCharacter = 0;

/**空格 */

private int spaceCharacter = 0;

/**数字 */

private int numberCharacter = 0;

/**其他字符 */

private int otherCharacter = 0;

//记录中文字符

private StringBuilder sb1=new StringBuilder();

//记录英文字符

private StringBuilder sb2=new StringBuilder();

//记录数字

private StringBuilder sb3=new StringBuilder();

//记录特殊字符

private StringBuilder sb4=new StringBuilder();

/***

* 统计字符串中中文,英文,数字,空格等字符个数

* @param str 需要统计的字符串

*/

public void count(String str) {

if(str.equals("") || str==null){

System.out.println("字符串为空");

return;

}

for (int i = 0; i < str.length(); i++) {

char tmp = str.charAt(i);

if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) {

enCharacter ++;

sb2.append(tmp+" ");

} else if ((tmp >= '0') && (tmp <= '9')) {

numberCharacter ++;

sb3.append(tmp +" ");

} else if (tmp ==' ') {

spaceCharacter ++;

} else if (isChinese(tmp)) {

chCharacter ++;

sb1.append(tmp+" ");

} else {

otherCharacter ++;

sb4.append(tmp +" ");

}

}

System.out.println("字符串:" + str + " \r\n");

System.out.println("中文字符有:" + chCharacter +"个 ("+sb1.toString()+")");

System.out.println("英文字符有:" + enCharacter +"个 ("+sb2.toString()+")");

System.out.println("数字有:" + numberCharacter+"个 ("+sb3.toString()+")");

System.out.println("空格有:" + spaceCharacter+"个");

System.out.println("其他字符有:" + otherCharacter+"个 ("+sb4.toString()+")");

}

/***

* 判断字符是否为中文

* @param ch 需要判断的字符

* @return 中文返回true,非中文返回false

*/

private boolean isChinese(char ch) {

//获取此字符的UniCodeBlock

Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch);

// GENERAL_PUNCTUATION 判断中文的“号

// CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号

if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS

|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG  RAPHS_EXTENSION_B

|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS

|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {

System.out.println(ch + " 是中文");

//sb1.append(ch+" ");

return true;

}

return false;

}

}

结果如下:

e824ee348617000d3c45ec50053770d8.png

总结

以上所述是小编给大家介绍的JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对聚米学院网站的支持!

如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值